数据统计中的峰度与偏度
峰度:
峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。
峰度包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)
峰度的取值范围为[1,+∞),完全服从正态分布的数据的峰度值为 3,峰度值越大,概率分布图越高尖,峰度值越小,越矮胖。
偏度:
偏度是衡量随机变量的概率分布偏离正态分布的程度
尾巴在右边的概率分布是正偏态分布,尾巴在左边的概率分布是负偏态分布。
偏度的取值范围为(-∞,+∞)
当偏度<0时,概率分布图左偏。
当偏度=0时,表示数据相对均匀的分布在平均值两侧,不一定是绝对的对称分布。
当偏度>0时,概率分布图右偏。
matlab图解如下
h = figure()set(h,'position',[50 50 1500 700]);x1 = randn(1,20000);subplot(231)histogram(x1)title(['x1 is ',num2str(kurtosis(x1)),' 正态分布 (kurtosis=3)'],'Fontsize',10)subplot(232)x2 = sqrt(abs(x1))-mean(sqrt(abs(x1)));histogram(x2)title(['x2 is ',num2str(kurtosis(x2)),' 峰度降低 (kurtosis<3)'],'Fontsize',10)subplot(233)x3 = x1.^3 - mean(x1.^3);histogram(x3)title(['x3 is ',num2str(kurtosis(x3)),' 峰度上升 (kurtosis>3)'],'Fontsize',10)subplot(234)x4 = x1;histogram(x4)title(['x4 is ',num2str(skewness(x4)),' 正态分布 (skewness=0)'],'Fontsize',10)subplot(235)m = -10 + 2*x1; % mean = -1 ; std = 2x5 = x1.*m;histogram(x5)title(['x5 is ',num2str(skewness(x5)),' 偏度左移 (skewness>0)'],'Fontsize',10)subplot(236)x6 = -x5histogram(x6)title(['x6 is ',num2str(skewness(x6)),' 偏度右移 (skewness<0)'],'Fontsize',10)subplot(2,3,5)xlim([-8 53])ylim([11 763])
运行结果如下:
如果觉得《【数模】数据统计中的峰度与偏度》对你有帮助,请点赞、收藏,并留下你的观点哦!