失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 统计学名词解释 —— 6. 三大抽样分布(卡方分布 t分布 F分布)

统计学名词解释 —— 6. 三大抽样分布(卡方分布 t分布 F分布)

时间:2021-02-07 05:55:23

相关推荐

统计学名词解释 —— 6. 三大抽样分布(卡方分布 t分布 F分布)

文章目录

x2x^2x2 分布基本概念函数密度图像基本性质例题ttt 分布基本概念函数密度图像例题FFF 分布基本概念函数密度图像例题

从经验可知,大部分的样本分布服从或近似服从「正态分布」。现在我们要看看和正态分布有所异同,也是非常常见的三大分布都是什么样的。

x2x^2x2 分布

Y∼X2(n)Y \sim X^2(n)Y∼X2(n) 分布又称卡方分布,它的定义如下:

基本概念

设 X1,X2,⋯,XnX_1, X_2, \cdots, X_nX1​,X2​,⋯,Xn​ 来自正态分布总体 N(0,1)N(0, 1)N(0,1) 的样本,则称统计量

Y=X12+X22+⋯Xn2Y = X_1^2 + X_2^2 + \cdots X_n^2 Y=X12​+X22​+⋯Xn2​

服从自由度为 nnn 的 X2X^2X2 分布,记为 Y∼X2(n)Y \sim X^2(n)Y∼X2(n),X2(n)X^2(n)X2(n) 分布的概率密度函数为:

f(y)={12n/2Γ(n/2)yn/2−1e−y/2y>00otherwisef(y) = \left \{ \begin{matrix} \frac{1}{2^{n/2} \Gamma (n / 2)} y^{n/2-1} e^{-y / 2} & y > 0 \\ 0 & otherwise \end{matrix} \right . f(y)={2n/2Γ(n/2)1​yn/2−1e−y/20​y>0otherwise​

函数密度图像

这张图主要说明,随着样本数增加,卡方分布的概率密度图像逐渐从类似 logloglog 的对数图像逐渐接近柏松分布。使得「概率密度图像(PDF)」呈现出和「泊松等待」相类似的特征。

由于组成卡方分布的每个样本 XXX 来自标准正态分布,所以每个独立样本的期望 E(X)=0E(X) = 0E(X)=0,方差 D(X)=1D(X) = 1D(X)=1。

基本性质

对于 X2X^2X2 分布来说它有两个性质

其一:

当 X2X^2X2 分布的期望 E(Y)=nE(Y) = nE(Y)=n时,它的方差 D(Y)=2nD(Y) = 2nD(Y)=2n

其二:

X2X^2X2 分布具有可加性。

比如,有 X∼Y2(m)X \sim Y^2(m)X∼Y2(m) 和 Y∼Y2(n)Y \sim Y^2(n)Y∼Y2(n),且 X 和 Y 相互独立,有 X+Y∼X2(m+n)X+Y \sim X^2(m+n)X+Y∼X2(m+n)

例题

设 (X1,X2,⋯,X6)(X_1, X_2, \cdots, X_6)(X1​,X2​,⋯,X6​) 为取自标准正态总体 N(0,1)N(0, 1)N(0,1) 的一个样本,求下列三个统计量的分布

(1) X12+X22X_1^2 + X_2^2X12​+X22​

(2)X12X_1^2X12​

(3)X12+a(X2+X3)2+b(X4+X5+X6)2X_1^2 + a(X_2 + X_3)^2 + b(X_4 + X_5 + X_6)^2X12​+a(X2​+X3​)2+b(X4​+X5​+X6​)2

解(1):

由样本定义可知,X1,X2,⋯X6X_1, X_2, \cdots X_6X1​,X2​,⋯X6​ 彼此相互独立,且服从 N(0,1)N(0,1)N(0,1),所以 X12+X22∼X2(2)X_1^2 + X_2^2 \sim X^2(2)X12​+X22​∼X2(2)

解(2):

由样本定义可知,X1,X2,⋯X6X_1, X_2, \cdots X_6X1​,X2​,⋯X6​ 彼此相互独立,且服从 N(0,1)N(0,1)N(0,1),因此对于单个元素它的卡方分布为 X12∼X2(1)X_1^2 \sim X^2(1)X12​∼X2(1)

解(3):

从卡方分布的定义出发,我们令

Y1=X12Y2=a(X2+X3)2Y3=b(X4+X5+X6)2Y_1 = X_1^2 \\ Y_2 = a(X_2 + X_3)^2 \\ Y_3 = b(X_4 + X_5 + X_6)^2Y1​=X12​Y2​=a(X2​+X3​)2Y3​=b(X4​+X5​+X6​)2

对于 Y1=X12Y_1 = X_1^2Y1​=X12​来说,由于元素来自标准正态总体,所以 Y1Y_1Y1​ 的期望 E(Y1)=0E(Y_1) = 0E(Y1​)=0,方差 D(Y1)=1D(Y_1) = 1D(Y1​)=1,所以 Y1∼N(0,1)Y_1 \sim N(0, 1)Y1​∼N(0,1)

对于 Y2=a(X2+X3)2Y_2 = a(X_2 + X_3)^2Y2​=a(X2​+X3​)2 来说,它有两个离散的样本,在 《概率论基础 —— 8.数学期望、方差、协方差》 一节中,我们可以知道由样本 (X2,X3)(X_2, X_3)(X2​,X3​) 组成的离散集合,我们可以通过离散型期望、方差的计算方法得到 E(X2,X3)=E(X2)+E(X3)=0E(X_2, X_3) = E(X_2) + E(X_3) = 0E(X2​,X3​)=E(X2​)+E(X3​)=0,其方差 D(X2,X3)=D(X2)+D(X3)=2D(X_2, X_3) = D(X_2) +D(X_3) = 2D(X2​,X3​)=D(X2​)+D(X3​)=2,于是有 (X2+X3)∼N(0,2)(X_2 + X_3) \sim N(0, 2)(X2​+X3​)∼N(0,2) ,我们对正太分布进行标准化,代入如下公式:

X−μσ=X−02=X2\frac{X - \mu}{\sigma} = \frac{X - 0}{\sqrt{2}} = \frac{X}{\sqrt 2} σX−μ​=2​X−0​=2​X​

于是我们得到标准正态分布 X2+X32∼N(0,1)\frac{X_2 + X_3}{\sqrt 2} \sim N(0, 1)2​X2​+X3​​∼N(0,1)

同理,对于 Y3=b(X4+X5+X6)2Y_3 = b(X_4 + X_5 + X_6)^2Y3​=b(X4​+X5​+X6​)2,它的样本集合 (X4,X5,X6)(X_4, X_5, X_6)(X4​,X5​,X6​) 的期望为0,方差为3,其标准正态分布为 X4+X5+X63\frac{X_4 + X_5 + X_6}{\sqrt 3}3​X4​+X5​+X6​​

再从卡方分布的基本概念出发,拼凑出它应该为

X2=X12+(X2+X32)2+(X4+X5+X63)2=X12+(X2+X3)22+(X4+X5+X6)23X^2 = X_1^2 + \left (\frac{X_2 + X_3}{\sqrt 2} \right )^2 + \left ( \frac{X_4 + X_5 + X_6}{\sqrt 3} \right )^2 = X_1^2 + \frac{(X_2 + X_3)^2}{2} + \frac{(X_4 + X_5 + X_6)^2}{3} X2=X12​+(2​X2​+X3​​)2+(3​X4​+X5​+X6​​)2=X12​+2(X2​+X3​)2​+3(X4​+X5​+X6​)2​

所以,a=12a=\frac{1}{2}a=21​, b=13b = \frac{1}{3}b=31​

ttt 分布

基本概念

设 X∼N(0,1)X \sim N(0, 1)X∼N(0,1),Y∼X2(n)Y \sim X^2(n)Y∼X2(n),且 X, Y 相互独立,则称随机变量

t=XY/nt = \frac{X}{\sqrt{Y / n}} t=Y/n​X​

服从自由度为 nnn 的 ttt 分布,记为 t∼t(n)t \sim t(n)t∼t(n)。t(n)t(n)t(n) 分布的概率密度函数函数为:

h(t)=Γ[(n+1)/2]πnΓ(n/2)(1+t2n)−(n+1)/2,−∞<t<∞h(t) = \frac{\Gamma [(n+1) / 2]}{\sqrt{\pi n} \Gamma(n / 2)} (1 + \frac{t^2}{n})^{-(n+1) / 2}, -\infty < t < \infty h(t)=πn​Γ(n/2)Γ[(n+1)/2]​(1+nt2​)−(n+1)/2,−∞<t<∞

函数密度图像

例题

假设总体 X∼N(0,32)X \sim N(0, 3^2)X∼N(0,32),X1,X2,⋯XnX_1, X_2, \cdots X_nX1​,X2​,⋯Xn​ 是来自总体X的简单随机样本,则统计量

Y=X1+X2+X3+X4X52+X62+X72+X82Y = \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{X_5^2 + X_6^2 + X_7^2 + X_8^2}}Y=X52​+X62​+X72​+X82​​X1​+X2​+X3​+X4​​ 服从自由度为____ 的 __________ 分布。

解:

我们从t分布的基本定义入手

t=XY/nt = \frac{X}{\sqrt{Y / n}} t=Y/n​X​

注意对于t分布的要求,其中的元素必须服从 X∼N(0,1)X \sim N(0, 1)X∼N(0,1),分母的Y是卡方分布,Y∼X2(n)Y \sim X^2(n)Y∼X2(n)。

所以令 Z=X1+X2+X3+X4∼N(0,36)Z=X_1 + X_2 + X_3 + X_4 \sim N(0, 36)Z=X1​+X2​+X3​+X4​∼N(0,36),我们可以标准化这个分布后得到 Z6∼N(0,1)\frac{Z}{6} \sim N(0, 1)6Z​∼N(0,1)。

分母虽然看起来很像卡方分布,但是由于假设的总体 X∼N(0,32)X \sim N(0, 3^2)X∼N(0,32),所以我们要先对它进行标准化后,可以得到 Xi3∼N(0,1)\frac{X_i}{3} \sim N(0, 1)3Xi​​∼N(0,1),然后凑出一个卡方分布得到

Y′=(X53)2+(X63)2+(X73)2+(X83)2=X52+X62+X72+X829∼X2(4)Y' = \left ( \frac{X_5}{3} \right )^2 + \left ( \frac{X_6}{3} \right )^2 + \left ( \frac{X_7}{3} \right )^2 + \left ( \frac{X_8}{3} \right )^2 = \frac{X_5^2 + X_6^2 + X_7^2 + X_8^2}{9} \sim X^2(4) Y′=(3X5​​)2+(3X6​​)2+(3X7​​)2+(3X8​​)2=9X52​+X62​+X72​+X82​​∼X2(4)

然后分别把得到的 ZZZ 和 Y′Y'Y′ 代入 ttt 分布公式中,于是得到

t=X/6Y′/4=16X1+X2+X3+X4X52+X62+X72+X829×4=X1+X2+X3+X4X52+X62+X72+X82∼t(4)t = \frac{X / 6}{\sqrt{Y' / 4}} = \frac{1}{6} \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{ \frac{X_5^2 + X_6^2 + X_7^2 + X_8^2}{9 \times 4}}} = \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{X_5^2 + X_6^2 + X_7^2 + X_8^2}} \sim t(4) t=Y′/4​X/6​=61​9×4X52​+X62​+X72​+X82​​​X1​+X2​+X3​+X4​​=X52​+X62​+X72​+X82​​X1​+X2​+X3​+X4​​∼t(4)

所以它是自由度为4的t分布。

FFF 分布

基本概念

设 U∼X2(n1)U \sim X^2(n_1)U∼X2(n1​),V∼X2(n2)V \sim X^2(n_2)V∼X2(n2​),且 UUU,VVV 相互独立,则称随机变量

F=U/n1V/n2F = \frac{U / n_1}{V / n_2} F=V/n2​U/n1​​

服从自由度为 (n1,n2)(n_1, n_2)(n1​,n2​) 的 FFF 分布,记为 F∼F(n1,n2)F \sim F(n_1, n_2)F∼F(n1​,n2​)。F(n1,n2)F(n_1, n_2)F(n1​,n2​) 分布的概率密度函数为:

φ(y)={Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)−11y>00otherwise\varphi (y) = \left \{ \begin{matrix} \frac{\Gamma [(n_1 + n_2) / 2] (n_1 / n_2)^{n_1 / 2} y^{(n_1 / 2) - 1}}{1} & y > 0 \\ 0 & otherwise \end{matrix} \right . φ(y)={1Γ[(n1​+n2​)/2](n1​/n2​)n1​/2y(n1​/2)−1​0​y>0otherwise​

函数密度图像

例题

设随机变量 T∼t(n)T \sim t(n)T∼t(n),F=1T2F = \frac{1}{T^2}F=T21​ 求随机变量F的分布

解:

先从 ttt 分布的定义出发,它是

t=XY/nt = \frac{X}{\sqrt{Y / n}} t=Y/n​X​

其中 X∼N(0,1)X \sim N(0, 1)X∼N(0,1),Y∼X2(n)Y \sim X^2(n)Y∼X2(n),所以我们得到 T=XY/nT = \frac{X}{\sqrt{Y / n}}T=Y/n​X​。代入 F=1T2F = \frac{1}{T^2}F=T21​ 后,我们有

F=Y/nX2F = \frac{Y / n}{X^2} F=X2Y/n​

由于我们前面已经假设了 X∼N(0,1)X \sim N(0, 1)X∼N(0,1),所以当 Y′=X2Y' = X^2Y′=X2 时,它自然也是卡方分布,且只有一个元素,于是有 Y′∼X2(1)Y' \sim X^2(1)Y′∼X2(1),参考F分布的定义,我们有

F′=U/n1V/n2F' = \frac{U / n_1}{V / n_2} F′=V/n2​U/n1​​

且 UUU,VVV 均是卡方分布,我们代入已知的 Y/nY / nY/n 到 U/n1U / n_1U/n1​,Y′Y'Y′ 可等价于 Y′/1Y' / 1Y′/1 并且 YYY 和 Y′Y'Y′互相独立,于是也可以代入到 V/n2V/n_2V/n2​,得到最终 F′F'F′ 的分布

F′=Y/nY′/1=Y/nX2F' = \frac{Y / n}{ Y' / 1} = \frac{Y / n}{X^2} F′=Y′/1Y/n​=X2Y/n​

所以 F=F′F = F'F=F′,于是 F∼F(n,1)F \sim F(n , 1)F∼F(n,1)。

如果觉得《统计学名词解释 —— 6. 三大抽样分布(卡方分布 t分布 F分布)》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。