失眠网 > PCA算法中样本方差和协方差的无偏估计与n-1的由来

PCA算法中样本方差和协方差的无偏估计与n-1的由来

时间：2022-01-20 07:43:04

原文出处：/s/blog_c96053d60101n24f.html

在PCA算法中的方差协方差计算公式中除数为什么是n-1?

假设X为独立同分布的一组随机变量，总体为M，随机抽取N个随机变量构成一个样本，和是总体的均值和方差,是常数。是对样本的均值和方差，由于样本是随机抽取的，也是随机的。

既然是随机变量，就可以观察他们的均值方差。

这里需要注意的是，由于样本是随机的，所以X1，X2，X3...都是随机的。上式中可以看出，样本均值这个变量的期望就是总体的均值，因此可以说均值是无偏的。

接下来看样本方差的均值：

结合方差公式，可以得到方差的期望与方差之间的关系：

（方差的期望=(n-1/n)方差）

这里可以看出样本方差的期望并不是无偏的，要无偏估计，应该再乘上一个系数：

所以无偏估计的样本的方差：

。

n-1为自由度，就是说，在一个容量为n的样本里，当确定了n-1个变量以后，第n个变量就确定了，因为样本均值是无偏的。

协方差除以m-1原理和方差一样，因为方差为协方差的特殊情况。

如果觉得《PCA算法中样本方差和协方差的无偏估计与n-1的由来》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。