隱馬爾可夫模型與詞性標註(上)

2021-07-27 16:38:27 字數 551 閱讀 1681

關於隱馬爾科夫模型,在我愛自然語言處理上有乙個很生動形象的解釋:

至少要知道以下幾點:

(1)hmm是乙個數學模型,包括隱藏狀態集合、觀察狀態集合、觀察狀態的初始概率向量π, 隱藏狀態間的轉移矩陣a,隱藏狀態轉換為觀察狀態的混淆矩陣b,b又叫做發射矩陣,隱藏狀態轉換為觀察狀態成為發射狀態。

(2)hmm由π,a,b三個引數可以確定,hmm(π,

a,b)。

(3)hmm可以用來解決三個問題:

a. 給定乙個模型,如何計算某個特定的觀測序列的概率;

b. 給定乙個模型和某個特定的觀測序列,如何找到最可能產生這個輸出的隱藏狀態序列;

c. 給定足夠的觀測資料,如何估計hmm的三個引數  。

(4)語音識別主要關注第一和第三個問題,詞性標註主要關注第二和第三個問題。

(5)a 可以通過前向演算法快速解決,b 需要利用viterbi演算法解決,c 有兩種方法解決:有監督或者無監督方法訓練引數。有監督的引數訓練通過標註訓練集統計獲得相關引數,難度較低;無監督的引數訓練則通過鮑姆-韋爾奇演算法迭代訓練獲得,難度很大。

標註問題以及隱馬爾可夫模型

序列標註問題 給定乙個句子x1 xn,生成乙個與之對應的序列y1 yn.如詞性標註。序列標註的目標是從訓練資料中學習乙個從句子到標註序列的對映。詞性標註的乙個難點是歧義。英文中的許多單詞可以有不同的詞性。另外乙個問題是訓練語料不可能窮盡所有的單詞,如何確定訓練語料中沒出現過單詞的詞性同樣值得研究。詞...

隱馬爾可夫模型

隱 馬爾可夫模型 hidden markov model,hmm 作為一種統計分析模型,創立於20世紀70年代。80 年代得到了傳播和發展,成為訊號處理的乙個重要方向,現已成功地用於語音識別 行為識別,文字識別以及故障診斷等領域。隱馬爾可夫模型是馬爾可夫鏈的一種,它的狀態不能直接觀察到,但能通過觀測...

隱馬爾可夫模型

對隱馬爾可夫模型的解釋,個人覺得一句簡單概括就是 在馬爾可夫鏈的情況下對每乙個狀態都加入乙個單獨輸出口,而我們把這個輸出口定為可視視窗,可把馬爾可夫鏈放到裡面藏起來。ok!這樣就是知道隱馬爾可夫模型的結構了。通過如下例子來說明hmm的含義。假定乙個暗室中有n個口袋,每個口袋中有m種不同顏色的球,乙個...