語音識別 之 GMM HMM

2021-10-23 20:54:39 字數 270 閱讀 9348

gmm,gaussian mixture model,gmm,高斯混合模型。

資料往往不知道是哪個高斯分布,這給gmm的引數初始化帶來困難。所有聚類演算法都可用於此,常用的有k-means、lbg等。

模型自適應,由於各地口音,採集裝置,環境雜訊等因素的差異,已訓練過的gmm-hmm很可能和新領域的測試資料不匹配,導致識別效果變差,甚至效能急劇下降,因此需要做自適應訓練。有最大後驗概率估計map,最大線性似然回歸是兩種經典的自適應演算法mllr。

匹配反正也是通過類似動態規劃實現的。

GMM HMM語音識別

現在假設知道了hmm模型中的乙個狀態 比如,孤立此識別中,這裡乙個狀態代表乙個詞 對應的k個多維高斯的所有引數,則該gmm生成該狀態 該詞 上某乙個觀察向量 的概率就出來了,即,知道了某個孤立詞對應的k個高斯模型的所有引數,那麼,就可以計算一幀觀測值對於該詞的概率。以下是文獻中提到的 機器學習 資料...

語音識別 gmm hmm思考

簡單回顧一下今天所看的內容 gmm hmm pdf 概率密度函式,在這裡可以由gmm來估計,同樣也可以用dnn來估計。gmm 高斯混合模型,單高斯函式,多高斯函式。能擬合任何函式,這裡會涉及到均值方差等變數 語音有短時平穩的特性,可以用高斯混合模型來估計 從而就會有概率密度函式。hmm 隱馬爾科夫模...

語音識別 聲學模型(GMM HMM)

本文主要講解一下gmm hmm演算法聲學模型的大概思路!聲學模型的目的是將經mfcc提取的所有幀的特徵向量轉化為有序的音素輸出。概述如下 我們都知道hmm模型裡面有隱含狀態概念。我們需要弄明白音素hmm模型的隱含狀態與乙個音素之間的關係,通常乙個音素含有3到5個狀態,如果乙個包含代表乙個音素的hmm...