失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 【概率论与数理统计02】那些年 正态分布 指数分布 伽马分布 卡方分布之间的发生的

【概率论与数理统计02】那些年 正态分布 指数分布 伽马分布 卡方分布之间的发生的

时间:2022-03-04 10:49:35

相关推荐

【概率论与数理统计02】那些年 正态分布 指数分布 伽马分布 卡方分布之间的发生的

前记:书接上回,先来回顾一下四个分布之间的关系图。

图1 四个分布关系简图

3. 简洁的三哥——指数分布

指数分布及特性

形如其名,指数分布的概率密度函数应该是最简单的了,就是单纯的指数函数的形式

f(x)={λe−λx,x>00,x≤0.f(x) = \left\{ \begin{aligned} \lambda e^{-\lambda x},\quad &x>0\\ 0,\qquad&x \le0. \end{aligned} \right. f(x)={λe−λx,0,​x>0x≤0.​

指数分布只有一个参数 λ\lambdaλ,称为率参数。指数分布的期望和方差分别为 1/λ1/\lambda1/λ 和 1/λ21/\lambda^21/λ2。

图2 指数分布概率密度曲线

指数分布的物理意义是“要等到一个随机事件发生,需要经历多久时间”。举一个例子,例如 X∼Exp(0.25)X \sim \rm{Exp}(0.25)X∼Exp(0.25) 表示在单位时间内(一分钟,一小时或一年),该事件平均发生 0.25 次。那么直到事件发生需要 4 个小时,0.25 的倒数。与指数分布类似,伽马分布的物理意义是“要等到 α\alphaα 个随机事件都发生,需要经历多久时间”。因此 α\alphaα 个指数分布的和就是形状参数为 α\alphaα,尺度参数为 λ\lambdaλ 的伽马分布;反之,若伽马分布中 α=1\alpha=1α=1,说明只有一个指数分布参与求和,因此也就退化为指数分布。

正态分布与指数分布的关系

设随机变量 XXX 和 YYY 相互独立,都服从正态分布 N(0,σ2)N(0,\sigma^2)N(0,σ2),那么 Z=X2+Y2Z=X^2+Y^2Z=X2+Y2 服从指数分布。证明如下:

由于随机变量 XXX 和 YYY 相互独立,则 (X,Y)(X,Y)(X,Y) 的联合分布密度函数为

f(x,y)=fX(x)fY(y)=12πσe−x22σ2×12πσe−y22σ2=12πσ2e−x2+y22σ2f(x,y) = f_X(x)f_Y(y)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}} \times \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{y^2}{2\sigma^2}} = \frac{1}{2 \pi \sigma^2}e^{-\frac{x^2+y^2}{2\sigma^2}} f(x,y)=fX​(x)fY​(y)=2π​σ1​e−2σ2x2​×2π​σ1​e−2σ2y2​=2πσ21​e−2σ2x2+y2​

随机变量 ZZZ 的分布函数

FZ(z)=P(Z≤z)=P(X2+Y2≤z)=∬x2+y2≤z12πσ2e−x2+y22σ2dxdy=12πσ2∫02πdθ∫0ze−r22σ2rdr=1−e−z2σ2\begin{aligned} F_Z(z) &= P(Z \le z) = P(X^2 + Y^2 \le z) \\ &= \iint\limits_{x^2+y^2 \le z} \frac{1}{2 \pi \sigma^2}e^{-\frac{x^2+y^2}{2\sigma^2}} dxdy \\ & = \frac{1}{2 \pi \sigma^2} \int_0^{2 \pi}d \theta \int_0^{\sqrt{z}}e^{-\frac{r^2}{2\sigma^2}}rdr \\ & =1 - e^{-\frac{z}{2\sigma^2}} \end{aligned} FZ​(z)​=P(Z≤z)=P(X2+Y2≤z)=x2+y2≤z∬​2πσ21​e−2σ2x2+y2​dxdy=2πσ21​∫02π​dθ∫0z​​e−2σ2r2​rdr=1−e−2σ2z​​

故 ZZZ 的概率密度函数为

fZ(z)=FZ′(z)=12σ2e−z2σ2f_Z(z) = F'_Z(z) = \frac{1}{2\sigma^2}e^{-\frac{z}{2\sigma^2}} fZ​(z)=FZ′​(z)=2σ21​e−2σ2z​

很明显这是服从率参数为 1/2σ21/2\sigma^21/2σ2 的指数分布。

\newline

\newline

4. 神奇的四哥——卡方分布

卡方分布及特性

自由度为 nnn 的卡方分布的定义是 nnn 个标准正态分布的平方和,记为 χ2(n)\chi^2(n)χ2(n) 同时卡方分布也是伽马分布当 α=n/2\alpha = n/2α=n/2,λ=1/2\lambda = 1/2λ=1/2 时的特殊情况,其概率密度函数为

f(x)=12n/2Γ(n/2)xn/2−1e−x/2f(x) = \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2} f(x)=2n/2Γ(n/2)1​xn/2−1e−x/2

图3 卡方分布概率密度曲线

期望与方差分别为 nnn 和 2n2n2n,且满足独立可加性。

卡方分布与指数分布的关系

指数分布通过伽马分布构造卡方分布。

设 X1,X2,..,XnX_1,X_2,..,X_nX1​,X2​,..,Xn​ 是服从指数分布 Exp(λ)\rm{Exp(\lambda)}Exp(λ) 的独立随机变量,则根据指数分布与伽马分布的关系有,Xi∼Ga(1,λ)X_i \sim \rm{Ga}(1,\lambda)Xi​∼Ga(1,λ)。因为伽马分布具有可加性,则

X1+X2+⋯+Xn=∑i=1nXi∼Ga(n,λ)X_1 + X_2 + \dots+ X_n = \sum_{i=1}^nX_i\sim {\rm Ga}(n,\lambda) X1​+X2​+⋯+Xn​=i=1∑n​Xi​∼Ga(n,λ)

由伽马分布的线性性质有

2λ∑i=1nXi∼Ga(n,12)2\lambda\sum_{i=1}^nX_i \sim {\rm Ga}(n,\frac{1}{2}) 2λi=1∑n​Xi​∼Ga(n,21​)

因此有 2λ∑i=1nXi∼χ2(2n)2\lambda\sum_{i=1}^nX_i \sim \chi^2(2n)2λ∑i=1n​Xi​∼χ2(2n),即完成指数分布通过伽马分布构造卡方分布。

\newline

\newline

5. 小结

概率论的世界广阔而神秘,而统计分布只是其冰山一角,本文所记录的更是表面的浮冰,如有错误,恳请各位老师批评指正。愿我们大家共同进步!

【概率论与数理统计02】那些年 正态分布 指数分布 伽马分布 卡方分布之间的发生的那些事儿(下)

如果觉得《【概率论与数理统计02】那些年 正态分布 指数分布 伽马分布 卡方分布之间的发生的》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。