失眠网 > 概率论：中心极限定理马尔科夫不等式切比雪夫不等式大数定理

概率论：中心极限定理马尔科夫不等式切比雪夫不等式大数定理

时间：2023-12-20 21:16:07

一、中心极限定理

1.1 独立同分布的中心极限定理

1.1.1 定理

设X1,X2,...,Xn为相互独立、服从同一分布的随机变量序列，且E(Xi)=μ,D(Xi)=σ2≠0(i=1,2,...n)，则对于任意x，有：设X_1,X_2,...,X_n为相互独立、服从同一分布的随机变量序列，且E(X_i)=\mu,D(X_i)=\sigma^2\ne0(i=1,2,...n)，则对于任意x，有：设X1,X2,...,Xn为相互独立、服从同一分布的随机变量序列，且E(Xi)=μ,D(Xi)=σ2=0(i=1,2,...n)，则对于任意x，有：

lim⁡n→∞P{∑i=1nXi−nμnσ≤x}=∫−∞x12πe−t22dt=Φ(x)（1.1）\lim_{n\to\infty}P\begin{Bmatrix}{\sum_{i=1}^nX_i-n\mu\over\sqrt{n}\sigma}\le x\end{Bmatrix}=\int_{-\infty}^x{1\over\sqrt{2\pi}}e^{-{t^2\over2}}dt=\Phi(x)\quad\quad\quad\quad\quad\quad （1.1）limn→∞P{nσ∑i=1nXi−nμ≤x}=∫−∞x2π1e−2t2dt=Φ(x)（1.1）

该定理通常被称为林德伯格-莱维（Lindeberg-Levy）定理。

来看下上面定理的含义：

若记：

Yn=∑i=1nXi−nμnσY_n={\sum_{i=1}^nX_i-n\mu\over\sqrt{n}\sigma}Yn=nσ∑i=1nXi−nμ

记FYn(x)F_{Y_n}(x)FYn(x)为YnY_nYn的分布函数，则1.1式可以写成：

limn→∞FYn(x)=Φ(x)lim_{n\to\infty}F_{Y_n}(x)=\Phi(x)limn→∞FYn(x)=Φ(x)

这表明，当充分大时，YnY_nYn近似服从正态分布N(0,1)N(0,1)N(0,1)，即：

∑i=1nXi−nμnσ∽N(0,1){\sum_{i=1}^nX_i-n\mu\over\sqrt{n}\sigma}\backsim N(0,1)nσ∑i=1nXi−nμ∽N(0,1)

从而当n充分大时：

∑i=1n∽N(nμ,nσ2)（1.2）\sum_{i=1}^n\backsim N(n\mu,n\sigma^2)\quad\quad\quad\quad\quad\quad（1.2）∑i=1n∽N(nμ,nσ2)（1.2）

式1.2说明，不论X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn服从什么分布，只要满足定理的条件，当n充分大时，就可以把∑i=1nXi\sum_{i=1}^nX_i∑i=1nXi做为正态随机变量处理，这个性质很重要。

将定理稍作变形，可以得到这个表现形式：

X‾−μσn∽N(0,1){{\overline{X}-\mu}\over \sigma\sqrt{n}}\backsim N(0,1)σnX−μ∽N(0,1)

即：

X‾∽N(μ,σ2n)\overline{X}\backsim N(\mu,{\sigma^2\over n})X∽N(μ,nσ2)，其中X‾=1n∑i=1nXi\overline{X}={1\over n}\sum_{i=1}^nX_iX=n1∑i=1nXi

由以上推导可知，无论X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是服从什么分布，其算术平均值当n充分大是总是近似地服从正态分布。这一结果是数理统计中大样本理论的基础。

/view/6db8601ac950ad02de80d4d8d15abe23482f0338.html?fr=search

二、马尔科夫不等式&切比雪夫不等式

切比雪夫不等式描述了这样一个事实，事件大多会集中在平均值附近。且切比雪夫不等式是马尔科夫不等式的特殊情况，因此首先看下马尔科夫不等式

2.1 马尔科夫不等式

其不等式表示如下：

P(X≥a)≤E(X)aP(X\ge a)\le{E(X)\over a}P(X≥a)≤aE(X)，其中X≥0X\ge0X≥0

2.1.1 直观感受

通过μ=1.3，σ=0.5\mu=1.3，\sigma=0.5μ=1.3，σ=0.5的正态分布来展示：

2.1.2 证明

代数证明：

马尔科夫不等式有一个条件：X是一个非负的随机变量

E(x)=∫−∞+∞xf(x)dxE(x)=\int_{-\infty}^{+\infty}xf(x)dxE(x)=∫−∞+∞xf(x)dx

≥∫t+∞xf(x)dx\quad\quad\ge\int_t^{+\infty}xf(x)dx≥∫t+∞xf(x)dx

≥t∫t+∞f(x)dx\quad\quad\ge t\int_t^{+\infty}f(x)dx≥t∫t+∞f(x)dx

=tP(x≥t)\quad\quad=tP(x\ge t)=tP(x≥t)

将t从等式右端移到左端，得证

几何证明：

首先引入示性函数I{A}I_{\{A\}}I{A}的概念，示性函数只有在事件A成立时才返回1，否则为0. 我们需要使用的一个引理是，当事件是如下形式，如A={X>a}A=\{X>a\}A={X>a}时，示性函数的期望可以表示事件发生的概率，即E(I{A})=P(A)E(I_{\{A\}})=P(A)E(I{A})=P(A)。

引入示性函数后，我们就可以把概率我呢提转移到更直观的空间上。举例而言，我们知道，对于任意的非负x和b：

I{x≥b}≤xbI_{\{x\ge b\}}\le{x\over b}I{x≥b}≤bx

从几何角度来说，即xb{x\over b}bx在第一象限永远不低于I{x≥b}I_{\{x\ge b\}}I{x≥b}，如图所示：

将自变量换为随机变量X，上述不等式同样成立，再对不等式两边

求均值，就可以得到：

P(X≥b)≤E(X)bP(X\ge b)\le{E(X)\over b}P(X≥b)≤bE(X)

2.2 切比雪夫不等式

设随机变量X具有数学期望E(X)=μ，方差D(X)=σ2，则对于任意k>0都有：设随机变量X具有数学期望E(X)=\mu，方差D(X)=\sigma^2，则对于任意k>0都有：设随机变量X具有数学期望E(X)=μ，方差D(X)=σ2，则对于任意k>0都有：

P{∣X−E(X)∣≥kσ}≤1k2P\{|X-E(X)|\ge k\sigma\}\le{1\over k^2}P{∣X−E(X)∣≥kσ}≤k21

2.2.1 直观感受

2.2.2 证明

几何证明：

同样采用示性函数来证明，对于任意的x，a和b，由示性函数可知：

I{∣x−a∣≥b}≤(x−a)2b2I_{\{|x-a|\ge b\}}\le{(x-a)^2\over b^2}I{∣x−a∣≥b}≤b2(x−a)2

其中右半部分是一个二次函数，左半部分是两端取1的示性函数，这个不等式画出来如下所示：

二次函数的值在任意点都不会低于示性函数，其中，两个坐标轴的交点（原点）实际上为(a,0)(a,0)(a,0)，而两条虚线对应的x轴的值分别为a-b和a+b。

将自变量x变为随机变量X，以上不等式依然成立，此时再对不等式两边求均值，同时设定a为随机变量X的均值E(X)E(X)E(X)，就可以得到切比雪夫不等式：

P(∣X−μ∣≥b)≤Var(X)b2P(|X-\mu|\ge b)\le{Var(X)\over b^2}P(∣X−μ∣≥b)≤b2Var(X)

/question/27821324/answer/248693398

三、大数定理

3.1 随机变量序列依概率收敛

3.1.1 定义：

设随机变量序列Y1,Y2,...,Yn,...，若存在某常数a，使得∀ε>0,均有：limn→+∞P{∣Yn−a∣<ε}=1设随机变量序列Y_1,Y_2,...,Y_n,...，若存在某常数a，使得\forall \varepsilon>0,均有：lim_{n\to+\infty}P\{|Y_n-a|<\varepsilon\}=1设随机变量序列Y1,Y2,...,Yn,...，若存在某常数a，使得∀ε>0,均有：limn→+∞P{∣Yn−a∣<ε}=1

则称随机变量序列{Yn}依概率收敛于常数a，记为：Yn→Pa则称随机变量序列\{Y_n\}依概率收敛于常数a，记为：Y_n\xrightarrow{P}a则称随机变量序列{Yn}依概率收敛于常数a，记为：YnPa

3.1.2 性质

若Xn→Pa,Yn→b，且g(x,y)在(a,b)处连续，则g(Xn,Yn)→Pg(a,b)若X_n\xrightarrow{P}a,Y_n\xrightarrow{b}，且g(x,y)在(a,b)处连续，则g(X_n,Y_n)\xrightarrow{P}g(a,b)若XnPa,Ynb，且g(x,y)在(a,b)处连续，则g(Xn,Yn)Pg(a,b)

3.2 大数定理

3.2.1 定理一：切比雪夫定理的特殊情况

设随机变量序列X1,X2,...,Xn,...相互独立，且具有相同的数学期望和相同的方差σ2，作前n个随机变量的算术平均：设随机变量序列X_1,X_2,...,X_n,...相互独立，且具有相同的数学期望和相同的方差\sigma^2，作前n个随机变量的算术平均：设随机变量序列X1,X2,...,Xn,...相互独立，且具有相同的数学期望和相同的方差σ2，作前n个随机变量的算术平均：

1n∑k=1nXk=X‾{1\over n}\sum_{k=1}^nX_k=\overline{X}n1∑k=1nXk=X

则∀ε>0，有：则\forall \varepsilon>0，有：则∀ε>0，有：

limn→∞P{∣X‾−μ∣<ε}=limn→∞P{∣1n∑k=1n−μ∣<ε}=1lim_{n\to\infty}P\{|\overline{X}-\mu|<\varepsilon\}=lim_{n\to\infty}P\{|{1\over n}\sum_{k=1}^n-\mu|<\varepsilon\}=1limn→∞P{∣X−μ∣<ε}=limn→∞P{∣n1∑k=1n−μ∣<ε}=1

证明：

由于：

E(X‾)=E(1n∑k=1nXk)=1n⋅nμ=μE(\overline{X})=E({1\over n}\sum_{k=1}^nX_k)={1\over n}\centerdot n\mu=\muE(X)=E(n1∑k=1nXk)=n1⋅nμ=μ

D(X‾)=D(1n∑k=1nXk)=1n2∑k=1nD(Xk)=1n2⋅nσ2=σ2nD(\overline{X})=D({1\over n}\sum_{k=1}^nX_k)={1\over n^2}\sum_{k=1}^nD(X_k)={1\over n^2}\centerdot n\sigma^2={\sigma^2\over n}D(X)=D(n1∑k=1nXk)=n21∑k=1nD(Xk)=n21⋅nσ2=nσ2

由切比雪夫不等式得：

P{∣1n∑k=1nXk−μ∣<ε}≥1−σ2/nε2⟹limn→∞P{∣1n∑k=1nXk−μ∣<ε}=1P\{|{1\over n}\sum_{k=1}^nX_k-\mu|<\varepsilon\}\ge1-{\sigma^2/n\over\varepsilon^2}\implies lim_{n\to\infty}P\{|{1\over n}\sum_{k=1}^nX_k-\mu|<\varepsilon\}=1P{∣n1∑k=1nXk−μ∣<ε}≥1−ε2σ2/n⟹limn→∞P{∣n1∑k=1nXk−μ∣<ε}=1

3.2.2 定理二：伯努利大数定理

设事件A在每次试验中发生的概率为p，记nA为n次独立重复试验中A发生的次数，则∀ε>0，有：设事件A在每次试验中发生的概率为p，记n_A为n次独立重复试验中A发生的次数，则\forall\varepsilon>0，有：设事件A在每次试验中发生的概率为p，记nA为n次独立重复试验中A发生的次数，则∀ε>0，有：

limn→+∞P{∣nAn−P∣<ε}=1lim_{n\to+\infty}P\{|{n_A\over n}-P|<\varepsilon\}=1limn→+∞P{∣nnA−P∣<ε}=1

证明：

∵nA∽B(n,p),E(nAn)=1n⋅np=p,D(nAn)=1n2D(nA)=1n2⋅npq=pqn\because n_A\backsim B(n,p),E({n_A\over n})={1\over n}\centerdot np=p, D({n_A\over n})={1\over n^2}D(n_A)={1\over n^2}\centerdot npq={pq\over n}∵nA∽B(n,p),E(nnA)=n1⋅np=p,D(nnA)=n21D(nA)=n21⋅npq=npq

利用切比雪夫不等式可得：

∀ε>0，有P{∣nAn−p∣<ε}≥1−pqnε2\forall\varepsilon>0，有P\{|{n_A\over n}-p|<\varepsilon\}\ge1-{pq\over n\varepsilon^2}∀ε>0，有P{∣nnA−p∣<ε}≥1−nε2pq

即得：

limn→+∞P{∣nAn−p∣<ε}=1lim_{n\to+\infty}P\{|{n_A\over n}-p|<\varepsilon\}=1limn→+∞P{∣nnA−p∣<ε}=1

/view/2b88b411cc7931b765ce15f4.html?sxts=1591850252432

如果觉得《概率论：中心极限定理马尔科夫不等式切比雪夫不等式大数定理》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。