失眠网 > 西瓜书+实战+吴恩达机器学习（二一）概率图模型之贝叶斯网络

西瓜书+实战+吴恩达机器学习（二一）概率图模型之贝叶斯网络

时间：2023-07-21 10:52:03

文章目录

0. 前言1. 贝叶斯网络结构2. 近似推断2.1. 吉布斯采样3. 隐马尔可夫模型HMM

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔，我会非常开心的~

0. 前言

概率图模型是一类用图来表达变量相关关系的概率模型。图中的节点代表变量，图中的边代表变量之间存在某种联系。

贝叶斯网络利用有向无环图DAG来刻画变量之间的依赖关系。B=<G,θ>B=<G,\theta>B=<G,θ>，BBB表示贝叶斯网络，GGG表示有向无环图，θ\thetaθ表示参数，假设变量xix_ixi的父节点为πi\pi_iπi，则θxi∣πi=PB(xi∣πi)\theta_{x_i\mid\pi_i}=P_B(x_i\mid\pi_i)θxi∣πi=PB(xi∣πi)。

马尔可夫链：系统下一时刻的状态仅由当前状态决定，不依赖于以往任何状态。

1. 贝叶斯网络结构

贝叶斯网络的联合概率分布定义为：

PB(x1,...,xd)=∏i=1dPB(xi∣πi)=∏i=1dθxi∣πiP_B(x_1,...,x_d)=\prod_{i=1}^dP_B(x_i\mid \pi_i)=\prod_{i=1}^d\theta_{x_i\mid\pi_i} PB(x1,...,xd)=i=1∏dPB(xi∣πi)=i=1∏dθxi∣πi

有以下三种贝叶斯网络结构（图源：机器学习）：

其中，在同父结构中，给定x1x_1x1的值，x3x4x_3\ x_4x3x4条件独立，在顺序结构中，给定xxx的值，yzy\ zyz条件独立，在V型结构中，给定x4x_4x4的值，x1x2x_1\ x_2x1x2必不独立，但是如果x4x_4x4的取值未知，则x1x2x_1\ x_2x1x2相互独立。

判断有向图中条件独立性的方法，将有向图改为无向图：

找出图中的V型结构，在两个父节点之间加上无向边，称为“道德化”将所有的有向边改为无向边若变量xyx\ yxy在图上被变量集合zzz分开，但是去掉变量集合zzz之后，xyx\ yxy分属两个连通分支则称为xyx\ yxy被zzz有向分离，x⊥y∣zx\perp y\mid zx⊥y∣z

2. 近似推断

利用已知变量推断未知变量的分布称为“推断”，其核心是基于可观测变量推测出未知变量的条件分布。

2.1. 吉布斯采样

贝叶斯网络的近似推断常采用吉布斯采样（Gibbs sampling），这是MCMC方法之一。

令QQQ表示待查询变量，qqq为取值，EEE表示证据变量，eee为取值，目标是计算P(Q=q∣E=e)P(Q=q\mid E=e)P(Q=q∣E=e)，吉布斯采样算法如下所示（图源：机器学习）：

吉布斯采样实际上是一个马尔可夫链随机漫步，当t→∞t\rightarrow \inftyt→∞时，收敛于一个平稳分布，这恰好是P(Q=q∣E=e)P(Q=q\mid E=e)P(Q=q∣E=e)。

由于马尔可夫链通常需要很长时间才收敛，因此吉布斯采样的收敛速度较慢。

3. 隐马尔可夫模型HMM

隐马尔可夫模型（Hidden Markov Model）是结构最简单的动态贝叶斯网络。

HMM变量可以分为两组：

状态变量：yiy_iyi表示第iii个时刻的系统状态，通常假定系统状态是隐变量观测变量：xix_ixi表示第iii个时刻的观测值

HMM图结构如下图所示（图源：机器学习）：

联合概率分布定义为：

P(x1,y1,...,xn,yn)=P(y1)P(x1∣y1)∏i=2nP(yi∣yi−1)P(xi∣yi)P(x_1,y_1,...,x_n,y_n)=P(y_1)P(x_1\mid y_1)\prod_{i=2}^nP(y_i\mid y_{i-1})P(x_i\mid y_i) P(x1,y1,...,xn,yn)=P(y1)P(x1∣y1)i=2∏nP(yi∣yi−1)P(xi∣yi)

状态转移概率：模型在各个状态间的转换概率，记为矩阵AAA：

aij=P(yt+1=sj∣yt=si),i⩽i,j⩽Na_{ij}=P(y_{t+1}=s_j\mid y_t=s_i),\ \ i\leqslant i,j\leqslant N aij=P(yt+1=sj∣yt=si),i⩽i,j⩽N

输出观测概率：模型根据当前状态获得各个观测值的概况，记为矩阵BBB：

bij=P(xt=oj∣yt=si),1⩽i⩽N,1⩽j⩽Nb_{ij}=P(x_t=o_j\mid y_t=s_i),\ \ 1\leqslant i\leqslant N,1\leqslant j\leqslant N bij=P(xt=oj∣yt=si),1⩽i⩽N,1⩽j⩽N

初始状态概率：模型在初始时刻各状态出现的概率，记为π\piπ：

πi=P(y1=si)\pi_i=P(y_1=s_i) πi=P(y1=si)

如果这篇文章对你有一点小小的帮助，请给个关注，点个赞喔，我会非常开心的~

如果觉得《西瓜书+实战+吴恩达机器学习（二一）概率图模型之贝叶斯网络》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。