失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 西瓜书+实战+吴恩达机器学习(二一)概率图模型之贝叶斯网络

西瓜书+实战+吴恩达机器学习(二一)概率图模型之贝叶斯网络

时间:2023-07-21 10:52:03

相关推荐

西瓜书+实战+吴恩达机器学习(二一)概率图模型之贝叶斯网络

文章目录

0. 前言1. 贝叶斯网络结构2. 近似推断2.1. 吉布斯采样3. 隐马尔可夫模型HMM

如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

0. 前言

概率图模型是一类用图来表达变量相关关系的概率模型。图中的节点代表变量,图中的边代表变量之间存在某种联系。

贝叶斯网络利用有向无环图DAG来刻画变量之间的依赖关系。B=&lt;G,θ&gt;B=&lt;G,\theta&gt;B=<G,θ>,BBB表示贝叶斯网络,GGG表示有向无环图,θ\thetaθ表示参数,假设变量xix_ixi​的父节点为πi\pi_iπi​,则θxi∣πi=PB(xi∣πi)\theta_{x_i\mid\pi_i}=P_B(x_i\mid\pi_i)θxi​∣πi​​=PB​(xi​∣πi​)。

马尔可夫链:系统下一时刻的状态仅由当前状态决定,不依赖于以往任何状态。

1. 贝叶斯网络结构

贝叶斯网络的联合概率分布定义为:

PB(x1,...,xd)=∏i=1dPB(xi∣πi)=∏i=1dθxi∣πiP_B(x_1,...,x_d)=\prod_{i=1}^dP_B(x_i\mid \pi_i)=\prod_{i=1}^d\theta_{x_i\mid\pi_i} PB​(x1​,...,xd​)=i=1∏d​PB​(xi​∣πi​)=i=1∏d​θxi​∣πi​​

有以下三种贝叶斯网络结构(图源:机器学习):

其中,在同父结构中,给定x1x_1x1​的值,x3x4x_3\ x_4x3​x4​条件独立,在顺序结构中,给定xxx的值,yzy\ zyz条件独立,在V型结构中,给定x4x_4x4​的值,x1x2x_1\ x_2x1​x2​必不独立,但是如果x4x_4x4​的取值未知,则x1x2x_1\ x_2x1​x2​相互独立。

判断有向图中条件独立性的方法,将有向图改为无向图:

找出图中的V型结构,在两个父节点之间加上无向边,称为“道德化”将所有的有向边改为无向边若变量xyx\ yxy在图上被变量集合zzz分开,但是去掉变量集合zzz之后,xyx\ yxy分属两个连通分支则称为xyx\ yxy被zzz有向分离,x⊥y∣zx\perp y\mid zx⊥y∣z

2. 近似推断

利用已知变量推断未知变量的分布称为“推断”,其核心是基于可观测变量推测出未知变量的条件分布。

2.1. 吉布斯采样

贝叶斯网络的近似推断常采用吉布斯采样(Gibbs sampling),这是MCMC方法之一。

令QQQ表示待查询变量,qqq为取值,EEE表示证据变量,eee为取值,目标是计算P(Q=q∣E=e)P(Q=q\mid E=e)P(Q=q∣E=e),吉布斯采样算法如下所示(图源:机器学习):

吉布斯采样实际上是一个马尔可夫链随机漫步,当t→∞t\rightarrow \inftyt→∞时,收敛于一个平稳分布,这恰好是P(Q=q∣E=e)P(Q=q\mid E=e)P(Q=q∣E=e)。

由于马尔可夫链通常需要很长时间才收敛,因此吉布斯采样的收敛速度较慢。

3. 隐马尔可夫模型HMM

隐马尔可夫模型(Hidden Markov Model)是结构最简单的动态贝叶斯网络。

HMM变量可以分为两组:

状态变量:yiy_iyi​表示第iii个时刻的系统状态,通常假定系统状态是隐变量观测变量:xix_ixi​表示第iii个时刻的观测值

HMM图结构如下图所示(图源:机器学习):

联合概率分布定义为:

P(x1,y1,...,xn,yn)=P(y1)P(x1∣y1)∏i=2nP(yi∣yi−1)P(xi∣yi)P(x_1,y_1,...,x_n,y_n)=P(y_1)P(x_1\mid y_1)\prod_{i=2}^nP(y_i\mid y_{i-1})P(x_i\mid y_i) P(x1​,y1​,...,xn​,yn​)=P(y1​)P(x1​∣y1​)i=2∏n​P(yi​∣yi−1​)P(xi​∣yi​)

状态转移概率:模型在各个状态间的转换概率,记为矩阵AAA:

aij=P(yt+1=sj∣yt=si),i⩽i,j⩽Na_{ij}=P(y_{t+1}=s_j\mid y_t=s_i),\ \ i\leqslant i,j\leqslant N aij​=P(yt+1​=sj​∣yt​=si​),i⩽i,j⩽N

输出观测概率:模型根据当前状态获得各个观测值的概况,记为矩阵BBB:

bij=P(xt=oj∣yt=si),1⩽i⩽N,1⩽j⩽Nb_{ij}=P(x_t=o_j\mid y_t=s_i),\ \ 1\leqslant i\leqslant N,1\leqslant j\leqslant N bij​=P(xt​=oj​∣yt​=si​),1⩽i⩽N,1⩽j⩽N

初始状态概率:模型在初始时刻各状态出现的概率,记为π\piπ:

πi=P(y1=si)\pi_i=P(y_1=s_i) πi​=P(y1​=si​)

如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

如果觉得《西瓜书+实战+吴恩达机器学习(二一)概率图模型之贝叶斯网络》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。