隱馬爾可夫(HMM)

2021-09-17 04:26:48 字數 1990 閱讀 1152

隱馬爾可夫模型(hidden markov model,hmm)是統計模型,它用來描述乙個含有隱含未知引數的馬爾可夫過程。其難點是從可觀察的引數中確定該過程的隱含引數。

然後利用這些引數來作進一步的分析,例如模式識別。是在被建模的系統被認為是乙個馬爾可夫過程與未觀測到的(隱藏的)的狀態的統計馬爾可夫模型。

隱馬爾可夫模型是馬爾可夫鏈的一種,它的狀態不能直接觀察到,但能通過觀測向量序列觀察到,每個觀測向量都是通過某些概率密度分布表現為各種狀態,每乙個觀測向量是由乙個具有相應概率密度分布的狀態序列產生。

所以,隱馬爾可夫模型是乙個雙重隨機過程----具有一定狀態數的隱馬爾可夫鏈和顯示隨機函式集。

針對以下三個問題,人們提出了相應的演算法
評估問題: 前向演算法

解碼問題: viterbi演算法

學習問題: baum-welch演算法(向前向後演算法)

隱馬爾可夫模型(hmm)可以用五個元素來描述,包括2個狀態集合和3個概率矩陣:
隱含狀態 s

這些狀態之間滿足馬爾可夫性質,是馬爾可夫模型中實際所隱含的狀態。這些狀態通常無法通過直接觀測而得到。(例如s1、s2、s3等等)

可觀測狀態 o

在模型中與隱含狀態相關聯,可通過直接觀測而得到。(例如o1、o2、o3等等,可觀測狀態的數目不一定要和隱含狀態的數目一致。)

初始狀態概率矩陣 π

表示隱含狀態在初始時刻t=1的概率矩陣,(例如t=1時,p(s1)=p1、p(s2)=p2、p(s3)=p3,則初始狀態概率矩陣 π=[ p1 p2 p3 ].

隱含狀態轉移概率矩陣 a。

描述了hmm模型中各個狀態之間的轉移概率。

其中aij = p( sj | si ),1≤i,j≤n.

表示在 t 時刻、狀態為 si 的條件下,在 t+1 時刻狀態是 sj 的概率。

觀測狀態轉移概率矩陣 b (英文名為confusion matrix,直譯為混淆矩陣不太易於從字面理解)。

令n代表隱含狀態數目,m代表可觀測狀態數目,則:

bij = p( oi | sj ), 1≤i≤m,1≤j≤n.

表示在 t 時刻、隱含狀態是 sj 條件下,觀察狀態為 oi 的概率。

總結:一般的,可以用λ=(a,b,π)三元組來簡潔的表示乙個隱馬爾可夫模型。隱馬爾可夫模型實際上是標準馬爾可夫模型的擴充套件,新增了可觀測狀態集合和這些狀態與隱含狀態之間的概率關係。

評估問題。

給定觀測序列 o=o1o2o3…ot和模型引數λ=(a,b,π),怎樣有效計算某一觀測序列的概率,進而可對該hmm做出相關評估。例如,已有一些模型引數各異的hmm,給定觀測序列o=o1o2o3…ot,我們想知道哪個hmm模型最可能生成該觀測序列。通常我們利用forward演算法分別計算每個hmm產生給定觀測序列o的概率,然後從中選出最優的hmm模型。

這類評估的問題的乙個經典例子是語音識別。在描述語言識別的隱馬爾科夫模型中,每個單詞生成乙個對應的hmm,每個觀測序列由乙個單詞的語音構成,單詞的識別是通過評估進而選出最有可能產生觀測序列所代表的讀音的hmm而實現的。

解碼問題

給定觀測序列 o=o1o2o3…ot 和模型引數λ=(a,b,π),怎樣尋找某種意義上最優的隱狀態序列。在這類問題中,我們感興趣的是馬爾科夫模型中隱含狀態,這些狀態不能直接觀測但卻更具有價值,通常利用viterbi演算法來尋找。

這類問題的乙個實際例子是中文分詞,即把乙個句子如何劃分其構成才合適。例如,句子「發展中國家」是劃分成「發展-中-國家」,還是「發展-中國-家」。這個問題可以用隱馬爾科夫模型來解決。句子的分詞方法可以看成是隱含狀態,而句子則可以看成是給定的可觀測狀態,從而通過建hmm來尋找出最可能正確的分詞方法。

學習問題。

即hmm的模型引數λ=(a,b,π)未知,如何調整這些引數以使觀測序列o=o1o2o3…ot的概率盡可能的大。通常使用baum-welch演算法以及reversed viterbi演算法解決。

怎樣調整模型引數λ=(a,b,π),使觀測序列 o=o1o2o3…ot的概率最大?

隱馬爾可夫模型HMM

隱馬爾科夫模型 hidden markov model,以下簡稱hmm 是比較經典的機器學習模型了,它在語言識別,自然語言處理,模式識別等領域得到廣泛的應用。隱馬爾可夫模型hmm 當然,隨著目前深度學習的崛起,尤其是rnn,lstm等神經網路序列模型的火熱,hmm的地位有所下降。但是作為乙個經典的模...

隱馬爾可夫模型(HMM)

概率圖模型是一類用圖來表達變數相關關係的概率模型。它以圖為表示工具,最常見的是用乙個結點表示乙個或一組隨機變數,結點之間的邊表示變數間的概率相關關係,即 變數關係圖 根據邊的性質不同,概率圖模型可大致分為兩類 第一類是使用有向無環圖表示變數間的依賴關係,稱為有向圖模型或貝葉斯網 第二類是使用無向圖表...

HMM隱馬爾可夫模型

詞性標註演算法有claws,但是計算要計算每一條路徑,所以效率很低,所有有人提出了hmm 維特比演算法 動態規劃思想 記錄區域性最優來計算詞性標註,效率提高,markov model最開始應用在語音識別,如今,在分詞 pos標註和統計機器翻譯都得到廣泛運用。描述一類重要的隨機過程,這隨機過程是隨時間...