失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 【数学基础】无偏估计——为何样本方差需要除以(n-1)?

【数学基础】无偏估计——为何样本方差需要除以(n-1)?

时间:2019-09-12 20:02:42

相关推荐

【数学基础】无偏估计——为何样本方差需要除以(n-1)?

【fishing-pan:/u013921430 转载请注明出处】

相信在学习数理统计过程中,肯定很多人会下面这样的疑问

为什么样本方差是除以(n-1),而不是除以n呢?

那么今天就一起来看一下是为什么。

背景知识

为了方便后面的表述,我们用 Xˉ\bar{X}Xˉ 表示样本均值,用 S2S^{2}S2 表示样本方差,用 uuu 表示总体均值,用 σ2\sigma ^{2}σ2 表示总体方差。

总体方差

整体方差的求得过程如下;

σ2=D(X)=E((Xi−E(X))2)=E(Xi2−2XiE(X)+E(X)2)=1n(∑i=1n(Xi2)−2∑i=1nXiE(X)+nE(X)2)\begin{aligned} \sigma^{2} =D(X)&=E((X_{i}-E(X))^{2})\\ &=E(X_{i}^{2}-2X_{i}E(X)+E(X)^{2})\\ &=\frac{1}{n}(\sum_{i=1}^{n}(X_{i}^{2})-2\sum_{i=1}^{n}X_{i}E(X)+nE(X)^{2}) \end{aligned} σ2=D(X)​=E((Xi​−E(X))2)=E(Xi2​−2Xi​E(X)+E(X)2)=n1​(i=1∑n​(Xi2​)−2i=1∑n​Xi​E(X)+nE(X)2)​

由于∑i=1nXi=nE(X)\sum_{i=1}^{n}X_{i}=nE(X)∑i=1n​Xi​=nE(X) ,所以可得;

σ2=D(X)=E((Xi−E(X))2)=1n(∑i=1n(Xi2)−nE(X)2)=E(X2)−E(X)2\begin{aligned} \sigma^{2}=D(X) &=E((X_{i}-E(X))^{2})\\ &=\frac{1}{n}(\sum_{i=1}^{n}(X_{i}^{2})-nE(X)^{2})\\ &=E(X^{2})-E(X)^{2} \end{aligned} σ2=D(X)​=E((Xi​−E(X))2)=n1​(i=1∑n​(Xi2​)−nE(X)2)=E(X2)−E(X)2​

样本方差

S2=1n−1∑i=1n(Xi−Xˉ)2S^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}S2=n−11​i=1∑n​(Xi​−Xˉ)2

中心极限定理

设从均值为uuu,方差为σ2\sigma^{2}σ2 的一个任意总体中抽取容量为nnn的样本,当n 充分大的时候,样本均值的抽样分布服从N(u,σ2/n)N(u,\sigma^{2}/n)N(u,σ2/n) 的分布,即;

E(Xˉ)=uD(Xˉ)=σ2/n\begin{aligned} E(\bar{X})&=u\\ D(\bar{X})&=\sigma ^{2}/n \end{aligned} E(Xˉ)D(Xˉ)​=u=σ2/n​

无偏估计

如果 θ^\hat{\theta }θ^ 的期望等于 θ\thetaθ ,则称 θ^\hat{\theta }θ^ 是 θ\thetaθ 的无偏估计量,即

E(θ^)=θE(\hat{\theta })=\theta E(θ^)=θ

例如样本均值Xˉ\bar{X}Xˉ 是总体均值的无偏估计。

E(Xˉ)=1n∑i=1nE(Xi)=E(X)=uE(\bar{X})=\frac{1}{n}\sum_{i=1}^{n}E(X_{i})=E(X)=uE(Xˉ)=n1​i=1∑n​E(Xi​)=E(X)=u

所有的前期准备工作就此结束了。

判断S2S^{2}S2是否是σ2\sigma ^{2}σ2的无偏估计

先假设 S~2=1n∑i=1n(Xi−Xˉ)2\tilde{S}^{2}=\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}S~2=n1​∑i=1n​(Xi​−Xˉ)2;那么求E(S~2)E(\tilde{S}^{2})E(S~2) ;

E(S~2)=E(1n∑i=1n(Xi−Xˉ)2)=E(1n(∑i=1nXi2−nXˉ2))=1n(nE(X2)−nE(Xˉ2))\begin{aligned} E(\tilde{S}^{2})&=E(\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2})\\ &=E(\frac{1}{n}(\sum_{i=1}^{n}X_{i}^{2}-n\bar{X}^{2}))\\ &=\frac{1}{n}(nE(X^{2})-nE(\bar{X}^{2}))\\ \end{aligned} E(S~2)​=E(n1​i=1∑n​(Xi​−Xˉ)2)=E(n1​(i=1∑n​Xi2​−nXˉ2))=n1​(nE(X2)−nE(Xˉ2))​

由于σ2=D(X)=E(X2)−E(X)2\sigma^{2}=D(X)=E(X^{2})-E(X)^{2}σ2=D(X)=E(X2)−E(X)2 ,且样本均值服从N(u,σ2/n)N(u,\sigma^{2}/n)N(u,σ2/n) 的分布所以;

E(S~2)=E(1n−1∑i=1n(Xi−Xˉ)2)=E(1n(∑i=1nXi2−nXˉ2))=1n(nE(X2)−nE(Xˉ2))=1n(n(σ2+u2)−n(D(Xˉ)+u2))=1n(nσ2+nu2−σ2−nu2)=n−1nσ2\begin{aligned} E(\tilde{S}^{2})&=E(\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2})\\ &=E(\frac{1}{n}(\sum_{i=1}^{n}X_{i}^{2}-n\bar{X}^{2}))\\ &=\frac{1}{n}(nE(X^{2})-nE(\bar{X}^{2}))\\ &=\frac{1}{n}(n(\sigma ^{2}+u^{2})-n(D(\bar{X})+u^{2}))\\ &=\frac{1}{n}(n\sigma ^{2}+nu^{2}-\sigma ^{2}-nu^{2})\\ &=\frac{n-1}{n}\sigma ^{2} \end{aligned} E(S~2)​=E(n−11​i=1∑n​(Xi​−Xˉ)2)=E(n1​(i=1∑n​Xi2​−nXˉ2))=n1​(nE(X2)−nE(Xˉ2))=n1​(n(σ2+u2)−n(D(Xˉ)+u2))=n1​(nσ2+nu2−σ2−nu2)=nn−1​σ2​

所以,如果 S~2\tilde{S}^{2}S~2 除以nnn的话,S~2\tilde{S}^{2}S~2 不是 σ2\sigma ^{2}σ2 的无偏估计量,进而对其进行修正。令

S2=nn−1S~2=1n−1∑i=1n(Xi−Xˉ)2=σ2S^{2}=\frac{n}{n-1}\tilde{S}^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}=\sigma^{2}S2=n−1n​S~2=n−11​i=1∑n​(Xi​−Xˉ)2=σ2

从而使 S2S^{2}S2 成为了 σ2\sigma ^{2}σ2 的无偏估计量。这就是为什么样本方差除以的是(n-1)的原因,在实际运用中,可以用同一总体的不同样本的方差的均值来近似估计总体方差。而 S~2\tilde{S}^{2}S~2 是总体方差的渐进无偏估计量。

E(S~2)=(n−1nσ2)→σ2n→∞E(\tilde{S}^{2})=(\frac{n-1}{n}\sigma ^{2})\underset{n \to \infty }{\rightarrow\sigma ^{2}}E(S~2)=(nn−1​σ2)n→∞→σ2​

已完。。

如果觉得《【数学基础】无偏估计——为何样本方差需要除以(n-1)?》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。