1. hmm 的基本組成要素
乙個hmm模型可以用5個元素來描述,包過2個狀態集合和3個概率矩陣。其分別為
隱含狀態q
可觀測狀態o
初始狀態概率矩陣π
隱含狀態概率轉移矩陣a
觀測狀態轉移概率矩陣/發射概率b
引入幾個符號:
at(i) : 表示到第 t 個觀察值 o
t時處於 狀態 i 。
2. hmm 的三個基本問題
1) computing likelihood (計算似然)
給定乙個 hmm 觀察序列 o,和模型引數
λ=(a, b,
π),計算似然 p(o|λ)。
即
怎樣有效計算這一觀測序列出現的概率
2) decoding (解碼)
給定乙個 hmm 觀察序列o,和模型引數
λ=(a, b
,π),找到最優的隱藏序列q,即
怎樣尋找滿足這種觀察序列意義上最優的隱含狀態序列 q
3) learning (學習)
給定乙個hmm 觀察序列o,和 hmm 中的乙個狀態集合,學習 hmm 的 引數 a 、b、π。
即hmm的模型引數λ=(a,b,π)未知,如何求出這3個引數以使觀測序列o=o1o
2o3…o
t的概率盡可能的大。
3. computing likelihood: the forward alogrithm (前向演算法)
4. decoding: the viterbi alogrithm (維特比演算法)
5. training hmms: the forward-backward alogrithm (前向後向演算法)
C 語音識別(文字to語音 語音to文字)
最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...
C 語音識別(文字to語音 語音to文字)
最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...
語音識別技術
中科院聲學所將為奧運會提供語音技術支援 日前,由首信集團 首都資訊發展股份 牽頭 中科院聲學所參與其核心模組研製的 奧運會多語言服務 系統被北京奧組委正式採用。這標誌著聲學所在利用自身科研優勢 積極為 科技奧運 做貢獻方面取得了新的成果。從2002年開始,聲學所就參與了由科技部和北京市科委組織,北京...