200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 统计学复习笔记(二)—— 常见的概率分布卡方分布 t分布 F分布和中心极限定理

统计学复习笔记(二)—— 常见的概率分布卡方分布 t分布 F分布和中心极限定理

时间:2024-04-09 13:52:21

相关推荐

统计学复习笔记(二)—— 常见的概率分布卡方分布 t分布 F分布和中心极限定理

文章目录

离散型随机变量(Discrete Random Variable)的概率分布连续型随机变量(Continuous Random Variable)的概率分布基于正态分布的几个分布卡方(χ2)(\chi^2)(χ2)分布(Chi-square Distribution)ttt分布(t Distribution)FFF分布(F Distribution)中心极限定理(Central Limit Theorem)

离散型随机变量(Discrete Random Variable)的概率分布

二项分布(Binomial Distribution)X∼Bin(n,p)X\sim Bin(n,p)X∼Bin(n,p)

比如扔n次硬币,每一次扔硬币都是互相独立的,结果只包含正面和反面两种结果,出现正面的概率为ppp, 出现反面的概率是 qqq,p+q=1p+q=1p+q=1。设出现正面的次数是XXX, 那么

p(X=x)=Cnxpxqn−xp(X=x)=C^x_np^xq^{n-x}p(X=x)=Cnx​pxqn−x, E(X)=np,Var(X)=npqE(X)=np, Var(X)=npqE(X)=np,Var(X)=npq泊松分布(Poisson Distribution)X∼Pois(λ)X\sim Pois(\lambda)X∼Pois(λ)

一段时间内,事件发生的次数的概率。比如,一个小时内,5位顾客来店里的概率是多少?设顾客数为XXX,一个小时内的顾客数平均是λ\lambdaλ, 来店里的顾客数就服从Poisson Distribution。

p(X=x)=λe−λx!p(X=x)=\frac{\lambda e^{-\lambda}}{x!}p(X=x)=x!λe−λ​ ,E(X)=λ,Var(X)=λE(X)=\lambda, Var(X)=\lambdaE(X)=λ,Var(X)=λ

【当p趋近于0且n足够大时,Binomial Distribution近似等于Poisson Distribution。】

连续型随机变量(Continuous Random Variable)的概率分布

Probability Density FunctionorPDF: f(x)f(x)f(x)

Probability Mass FunctionorPMF: F(x)F(x)F(x)

F(x)=p(X≤x)=∫−∞xf(t)dtF(x)=p(X\leq x)=\int^x_{- \infty}f(t)dtF(x)=p(X≤x)=∫−∞x​f(t)dt, f(x)=F′(x)f(x)=F^{'}(x)f(x)=F′(x)

p(a<X<b)=∫abf(x)dx=F(a)−F(b)p(a<X<b)=\int^b_af(x)dx=F(a)-F(b)p(a<X<b)=∫ab​f(x)dx=F(a)−F(b),相当于density曲线下面在a和b之间的面积

期望与方差

E(X)=∫−∞+∞xf(x)=μE(X)=\int^{+\infty}_{-\infty}xf(x)=\muE(X)=∫−∞+∞​xf(x)=μ

Var(X)=∫−∞+∞[x−E(x)]2f(x)=σ2Var(X)=\int^{+\infty}_{-\infty}[x-E(x)]^2f(x)=\sigma^2Var(X)=∫−∞+∞​[x−E(x)]2f(x)=σ2

正态分布(Normal Distribution)X∼N(μ,σ2)X\sim N(\mu,\sigma^2)X∼N(μ,σ2)

f(x)=1σ2πe−12σ2(x−μ)2f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2\sigma^2}(x-\mu)^2}f(x)=σ2π​1​e−2σ21​(x−μ)2, μ\muμ决定图像中心位置,当x=μx=\mux=μ时,f(x)f(x)f(x)达到最大值,f(μ)=12πσf(\mu)=\frac{1}{2\pi\sigma}f(μ)=2πσ1​。 σ\sigmaσ越大,曲线越平缓。

标准正态分布(Standard Normal Distribution)Z=X−μσ∼N(0,1)Z=\frac{X-\mu}{\sigma}\sim N(0,1)Z=σX−μ​∼N(0,1)

PDF:φ(x)=12πe−x22PDF: \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}PDF:φ(x)=2π​1​e−2x2​

PMF:ϕ(x)=∫−∞x12πe−t22dtPMF:\phi(x)=\int^x_{-\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dtPMF:ϕ(x)=∫−∞x​2π​1​e−2t2​dt

正态分布概率问题中,将一般正态分布转化为标准正态分布后就可以查表,以及:ϕ(−x)=1−ϕ(x)\phi(-x)=1-\phi(x)ϕ(−x)=1−ϕ(x)

基于正态分布的几个分布

统计量(Statistics): X1,X2,...XnX_1,X_2,...X_nX1​,X2​,...Xn​是一个样本,那么由这些样本构造的函数:T(X1,X2,...Xn)T(X_1,X_2,...X_n)T(X1​,X2​,...Xn​)是样本的统计量。常见的统计量包括样本均值,样本方差等。

抽样分布(Sampling Distribution): 简单来说就是样本统计量的分布。在正态总体的情况下,可以推导出统计三大分布:χ2\chi^2χ2分布,ttt分布, FFF分布。

卡方(χ2)(\chi^2)(χ2)分布(Chi-square Distribution)

如果 X1,X2,...XnX_1,X_2,...X_nX1​,X2​,...Xn​相互独立且服从标准正态分布,那么Σi=1nXi2\Sigma_{i=1}^nX_i^2Σi=1n​Xi2​服从自由度(Degree of Freedom, or df)为n的χ2\chi^2χ2分布:X2∼χ(n)X^2\sim \chi(n)X2∼χ(n)。如果X12∼χ2(n1)X_1^2\sim \chi^2(n_1)X12​∼χ2(n1​),X22∼χ2(n2)X_2^2\sim \chi^2(n_2)X22​∼χ2(n2​),那么X12+X22∼χ2(n1+n2)X_1^2+X_2^2\sim \chi^2(n_1+n_2)X12​+X22​∼χ2(n1​+n2​)。不同的自由度下,卡方分布的PDFPDFPDF如下图:

ttt分布(t Distribution)

如果XXX服从标准正态分布,YYY服从自由度为nnn的卡方分布,且XXX和YYY相互独立,那么t=XY/nt=\frac{X}{\sqrt{Y/n}}t=Y/n​X​服从自由度为nnn的ttt分布:t∼t(n)t\sim t(n)t∼t(n)。ttt分布的PDF图像和正态分布很像,都是钟型,但ttt分布的尾部更厚一点,说明ttt分布比正态分布更容易观测到极端值。自由度越高,越接近正态分布。一般认为n≥30n\geq30n≥30时基本可以看做正态分布。不同自由度下的ttt分布和标准正态分布的PDFPDFPDF如下:

FFF分布(F Distribution)

如果V1,V2V_1,V_2V1​,V2​相互独立且满足自由度分别为n1n_1n1​和n2n_2n2​的卡方分布,那么X=V1/n1V2/n2X=\frac{V_1/n_1}{V_2/n_2}X=V2​/n2​V1​/n1​​满足自由度为n1n_1n1​和n2n_2n2​(两个自由度的位置不能交换)的FFF分布:X∼F(n1,n2)X\sim F(n_1,n_2)X∼F(n1​,n2​)。以及,如果X∼t(n)X\sim t(n)X∼t(n), 那么X2∼F(1,n)X^2\sim F(1,n)X2∼F(1,n)。不同自由度下的FFF分布PDF如下图:

中心极限定理(Central Limit Theorem)

样本均值Xˉ\bar{X}Xˉ是一个常见的统计量,前面说过抽样分布时是样本统计量的分布,而在总体服从N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的情况下, Xˉ\bar{X}Xˉ的抽样分布也是正态分布:Xˉ∼N(μ,σ2n)\bar{X}\sim N(\mu,\frac{\sigma^2}{n})Xˉ∼N(μ,nσ2​)。而当总体不服从正态分布的情况下,根据中心极限定理,如果nnn足够大,Xˉ\bar{X}Xˉ的分布也近似正态分布。设总体均值为μ\muμ, 总体方差为σ2\sigma^2σ2, 抽取样本量为nnn的样本,nnn足够大时,Xˉ\bar{X}Xˉ近似服从N(μ,σ2n)N(\mu,\frac{\sigma^2}{n})N(μ,nσ2​),或Xˉ−μσ/n\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}σ/n​Xˉ−μ​近似服从N(0,1)N(0,1)N(0,1)。

····················未完待续····················

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。