原文出处:/s/blog_c96053d60101n24f.html
在PCA算法中的方差协方差计算公式中除数为什么是n-1?
假设X为独立同分布的一组随机变量,总体为M,随机抽取N个随机变量构成一个样本,和是总体的均值和方差,是常数。是对样本的均值和方差,由于样本是随机抽取的,也是随机的。
既然是随机变量,就可以观察他们的均值方差。
这里需要注意的是,由于样本是随机的,所以X1,X2,X3...都是随机的。上式中可以看出,样本均值这个变量的期望就是总体的均值,因此可以说均值是无偏的。
接下来看样本方差的均值:
结合方差公式,可以得到方差的期望与方差之间的关系:
(方差的期望=(n-1/n)方差)
这里可以看出样本方差的期望并不是无偏的,要无偏估计,应该再乘上一个系数:
所以无偏估计的样本的方差:
。
n-1为自由度,就是说,在一个容量为n的样本里,当确定了n-1个变量以后,第n个变量就确定了,因为样本均值是无偏的。 协方差除以m-1原理和方差一样,因为方差为协方差的特殊情况
如果觉得《PCA算法中样本方差和协方差的无偏估计与n-1的由来》对你有帮助,请点赞、收藏,并留下你的观点哦!