失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 【机器学习】隐马尔可夫模型及其三个基本问题(一)

【机器学习】隐马尔可夫模型及其三个基本问题(一)

时间:2020-03-27 17:59:38

相关推荐

【机器学习】隐马尔可夫模型及其三个基本问题(一)

【机器学习】隐马尔可夫模型及其三个基本问题(一)

HMM模型1、HMM模型概述2、HMM的三个基本问题3、HMM问题实例参考资料

隐马尔可夫模型(Hidden Markov Model,HMM)是一种重要的有向图模型,使用隐马尔可夫模型的问题一般需要两个特征( 参考资料1):(1)问题是基于时间序列或状态序列的。(2)问题中有两种数据,一种是观测序列,即我们能够观测到的序列;一种是状态序列,即隐藏的、不可被观测的但决定对应的观测值的序列。

HMM模型

1、HMM模型概述

假设系统在NNN个状态之间切换,状态空间为Q={q1,q2,⋯ ,qN}Q = \left\{ {{q_1},{q_2}, \cdots ,{q_N}} \right\}Q={q1​,q2​,⋯,qN​}。

观测值的可能取值有MMM个,其集合为V={v1,v2,⋯ ,vM}V = \left\{ {{v_1},{v_2}, \cdots ,{v_M}} \right\}V={v1​,v2​,⋯,vM​}。

目前有一组长度为nnn的状态序列Y={y1,y2,⋯ ,yn}Y = \left\{ {{y_1},{y_2}, \cdots ,{y_n}} \right\}Y={y1​,y2​,⋯,yn​}。

对应的观测序列为X={x1,x2,⋯ ,xn}X = \left\{ {{x_1},{x_2}, \cdots ,{x_n}} \right\}X={x1​,x2​,⋯,xn​}。

其中任意一个观测值xt∈V{x_t} \in Vxt​∈V,任意一个状态值yt∈Q{y_t} \in Qyt​∈Q。为了简化模型,HMM做出两个假设:一个是观测值xtx_txt​由对应的状态值yty_tyt​确定,另一个是ttt时刻的状态值yty_tyt​仅依赖于t−1t-1t−1时刻的状态值yt−1y_{t-1}yt−1​(参考资料2)。HMM模型的图结构为:

三个重要概率概率:

(1)状态转移概率

ttt时刻的隐含状态为yt=qi{y_t} = {q_i}yt​=qi​的前提下,t+1t+1t+1时刻的隐含状态为yt+1=qj{y_{t+1}} = {q_j}yt+1​=qj​,其中i,j∈[0,N]i,j \in \left[ {0,N} \right]i,j∈[0,N]。则从时刻ttt到时刻t+1t+1t+1的状态转移概率aija_{ij}aij​为:aij=P(yt+1=qj∣yt=qi){a_{ij}} = P\left( {{y_{t + 1}} = {q_j}\left| {{y_t} = {q_i}} \right.} \right)aij​=P(yt+1​=qj​∣yt​=qi​)。

(2)输出观测概率

ttt时刻的隐含状态为yt=qi{y_t} = {q_i}yt​=qi​的前提下,对应的观测值为xt=vj{x_t} = {v_j}xt​=vj​,其中i∈[0,N]i\in \left[ {0,N} \right]i∈[0,N],j∈[0,M]j \in \left[ {0,M} \right]j∈[0,M]。则此刻观测值vjv_jvj​在隐含状态qiq_iqi​生成的概率bijb_{ij}bij​为:bij=P(xt=vj∣yt=qi){b_{ij}} = P\left( {{x_t} = {v_j}\left| {{y_t} = {q_i}} \right.} \right)bij​=P(xt​=vj​∣yt​=qi​)。

(3)初始状态概率:初始隐含状态为状态空间中第iii个状态的概率πi{\pi _i}πi​为:πi=P(y1=qi){\pi _i} = P\left( {{y_1} = {q_i}} \right)πi​=P(y1​=qi​)。其中i∈[0,N]i\in \left[ {0,N} \right]i∈[0,N]。

三个重要的矩阵:

(1)状态转移矩阵:A=[aij]N×NA = {\left[ {{a_{ij}}} \right]_{N \times N}}A=[aij​]N×N​

(2)输出观测矩阵:B=[bij]N×MB = {\left[ {{b_{ij}}} \right]_{N \times M}}B=[bij​]N×M​

(3)初始状态概率分布矩阵:∏=[πi]N×1\prod = {\left[ {{\pi _i}} \right]_{N \times 1}}∏=[πi​]N×1​

HMM模型由状态空间,观测值集合与上述三个矩阵确定,通常表示为:λ=[A,B,∏]\lambda = \left[ {A,B,\prod } \right]λ=[A,B,∏]。

2、HMM的三个基本问题

(1)评估观测序列概率

给定模型λ=[A,B,∏]\lambda = \left[ {A,B,\prod } \right]λ=[A,B,∏]和观测序列X={x1,x2,⋯ ,xn}X = \left\{ {{x_1},{x_2}, \cdots ,{x_n}} \right\}X={x1​,x2​,⋯,xn​},计算模型λ\lambdaλ下观测序列XXX出现的概率P(X∣λ)P\left( {X\left| \lambda \right.} \right)P(X∣λ)。

(2)模型参数学习问题

给定观测序列X={x1,x2,⋯ ,xn}X = \left\{ {{x_1},{x_2}, \cdots ,{x_n}} \right\}X={x1​,x2​,⋯,xn​},估计模型λ=[A,B,∏]\lambda = \left[ {A,B,\prod } \right]λ=[A,B,∏],使得该模型下观测序列的条件概率P(X∣λ)P\left( {X\left| \lambda \right.} \right)P(X∣λ)最大。

(3)解码问题(预测问题)

给定模型λ=[A,B,∏]\lambda = \left[ {A,B,\prod } \right]λ=[A,B,∏]和观测序列X={x1,x2,⋯ ,xn}X = \left\{ {{x_1},{x_2}, \cdots ,{x_n}} \right\}X={x1​,x2​,⋯,xn​},求最可能出现的对应状态序列max⁡Q{P(Q∣X,λ)}{\max _Q}\left\{ {P\left( {Q\left| {X,\lambda } \right.} \right)} \right\}maxQ​{P(Q∣X,λ)}

3、HMM问题实例

盒子与球模型(参考资料3):假设有4个盒子,每个盒子内都装有红色和白色两种球若干个,盒子内的红白球数如下:

开始,从4个盒子中等概率地选取一个盒子,从这个盒子中随机抽取一个球,记录颜色后放回,然后转移到下一个盒子,规则是:当前盒子为盒子1时,那么下一个盒子一定是盒子2,当前盒子为2或3时,分别以0.4和0.6的概率转移到左边或右边的盒子,当前盒子为盒子4时,这以0.5的概率留在盒子4或转移到盒子3.。

由上述问题可知:

隐含状态集合为:Q=[box1,box2,box3,box4]Q = [{\rm{box1,box2,box3,box4}}]Q=[box1,box2,box3,box4]

观测值集合为:V=[red,white]V = \left[ {red,white} \right]V=[red,white]

状态转移矩阵为:A=[00.400100.4000.600.5000.60.5]A = \left[ {\begin{matrix} {\begin{matrix} {\begin{matrix} {\begin{matrix} 0\\ {0.4}\\ 0\\ 0 \end{matrix}}&{\begin{matrix} 1\\ 0\\ {0.4}\\ 0 \end{matrix}} \end{matrix}}&{\begin{matrix} 0\\ {0.6}\\ 0\\ {0.5} \end{matrix}} \end{matrix}}&{\begin{matrix} 0\\ 0\\ {0.6}\\ {0.5} \end{matrix}} \end{matrix}} \right]A=⎣⎢⎢⎡​00.400​​100.40​​​00.600.5​​​000.60.5​​⎦⎥⎥⎤​

输出观测矩阵为:B=[0.50.30.60.80.50.70.40.2]B = \left[ {\begin{matrix} {\begin{matrix} {0.5}\\ {0.3}\\ {0.6}\\ {0.8} \end{matrix}}&{\begin{matrix} {0.5}\\ {0.7}\\ {0.4}\\ {0.2} \end{matrix}} \end{matrix}} \right]B=⎣⎢⎢⎡​0.50.30.60.8​​0.50.70.40.2​​⎦⎥⎥⎤​

初始状态概率分布矩阵为:∏=[0.25,0.25,0.25,0.25]T\prod = {\left[ {0.25,0.25,0.25,0.25} \right]^T}∏=[0.25,0.25,0.25,0.25]T

参考资料

1、/pinard/p/6945257.html

2、《机器学习》周志华

3、《统计学习方法》李航

如果觉得《【机器学习】隐马尔可夫模型及其三个基本问题(一)》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。