失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 数据分析统计学原理第六章:连续型概率分布 | 我的统计学原理复习日记

数据分析统计学原理第六章:连续型概率分布 | 我的统计学原理复习日记

时间:2021-06-17 02:13:29

相关推荐

数据分析统计学原理第六章:连续型概率分布 | 我的统计学原理复习日记

离散型随机变量和连续型随机变量之间最根本的区别在于,二者在概率计算上是不同的。对一个离散型随机变量,概率函数f(x)给出了随机变量x取某个特定值的概率。而对连续型随机变量,与概率函数相对应的是概率密度函数( probability density function),也记作f(x).不同的是,概率密度函数并没有直接给出概率。但是,给定区间上曲线f(x)下的面积是连续型随机变量在该区间取值的概率。因此,当计算连续型随机变量的概率时,我们计算的是随机变量在某个区间内取值的概率。

均匀概率分布(uniform probability distribution)

例子:

用面积度量概率

我们不再讨论随机变量取某一特定值的概率。取而代之,我们讨论随机变量在某一给定区间上取值的概率。

连续型随机变量在某个给定区间[x1,x2]上取值的概率,被定义为在区间[x1,x2]上概率密度函数f(x)曲线下的面积。因为单点是宽度为零的区间,这意味着连续型随机变量取某个特定值的概率为零。这也意味着,无论是否包括端点,连续型随机变量在某个区间上取值的概率是相同的。

连续型均匀概率分布的数学期望和方差

式中,a为随机变量所能取的最小值;b为随机变量所能取的最大值。

正态概率分布(normal probability distribution)

正态分布概率密度函数

我们观察到,正态分布具有下列特征

(1)正态分布族中的每个分布因均值和标准差这两个参数的不同而不同。

(2)正态曲线的最高点在均值处达到,均值还是分布的中位数和众数。

(3)分布的均值可以是任意数值:负数、零或正数。

(4)正态分布是对称的。均值左边的曲线形状是均值右边的曲线形状的镜像。曲线的尾端向两个方向无限延伸,且理论上永远不会与横轴相交。由于正态分布是对称的,从而它不是偏斜的,偏度为0。

(5)标准差决定曲线的宽度和平坦程度。标准差越大则曲线越宽、越平坦,表明数据有更大的变异性。

(6)正态随机变量的概率由正态曲线下的面积给出。正态分布曲线下的总面积是1,由于分布是对称的,曲线下方均值左侧的面积为0.5,曲线下方均值右侧的面积也是0.5。

(7)下面是随机变量在一些常用区间内取值的百分比。

a.正态随机变量有68.3%的值在均值加减一个标准差的范68.3%围内。

b.正态随机变量有95.4%的值在均值加减两个标准差的范围内

c.正态随机变量有99.7%的值在均值加减三个标准差的范围内。

标准正态概率分布( standard normal probability distribution)

均值为0,方差为1

我们对标准正态分布进行了深入的研究,因为所有正态分布的概率都可利用标准正态分布来计算。也就是说,对于具有任意均值和标准差的正态分布,我们在回答有关的概率问题前,首先应将其转换成标准正态分布,然后再使用标准正态概率表和恰当的z值来计算所需要的概率。

标准化公式

正态分布的概率计算例子:

二项概率的正态近似

当试验次数很大时,笔算或用计算器求解二项概率函数都是很困难的。在np≥5和n(1-p)≥5的情况下,正态分布是对二项分布的一个简便易行的近似。当使用正态分布近似二项分布时,正态曲线中平均值=np和标准差=√(np(1-p))

例子:

在得到平均值和标准差,以及确定了区间后,就可以将正态分布通过标准化转换成标准正态分布,接着通过查表得到区间的概率。

指数概率分布(exponential probability distribution)

指数分布的累计概率

指数分布是右偏的,偏度为2

泊松分布与指数分布的关系

泊松分布描述了每一区间中事件发生的次数,指数分布描述了事件发生的时间间隔长度。

例子:

如果觉得《数据分析统计学原理第六章:连续型概率分布 | 我的统计学原理复习日记》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。