機器學習的問題主要分為三類:分類問題,標註問題和回歸問題
標註問題的輸入是乙個觀測序列,輸出是乙個標記序列或者狀態序列。標註問題的乙個目標是訓練乙個模型,使它能夠對觀測序列給出標記序列和狀態序列。
常用的統計學習方法: 隱馬爾科夫模型,條件隨機場。
在資訊提取和自然語言處理中,標記問題是常見的基本問題。
在進行語音識別的時候,我們不知道語音的哪乙個部分對應的是哪乙個音素或者詞。首先想到的是,人為給它打上標籤,即每乙個音訊中的因素或者詞都根據發音字典等等被手動分開和標記。然而實際情況中由於工作量太大而無法操作,這就需要乙個方法能夠自動切分音素或者詞。
最常見的實現方式可以參考下圖:
圖中展示的主要是兩部分:
(1)根據字典建立隱馬爾科夫模型;
這個模型定義了一些反映發音的隱狀態
(2)特徵提取
提取mfcc特種
接下來最重要的是如何訓練得到hmm的引數問題?即如何得到轉移矩陣和發射概率。
乙個高效的訓練方法是直接使用viterbi解碼演算法訓練,這種訓練方法的另外一種叫法是維特比對齊或者強制對齊(forced alignment)。
因為每乙個發音都嵌在整個句子中,作為訓練的一部分,所以把這個訓練過程叫做嵌入式訓練。
(1)建立句子的hmm模型
(2)初始化轉移概率a
(3)使用訓練集的均值和方差初始化發射概率b
(4)使用viterbi演算法訓練,得到b
這種訓練方法的基本思路是:在知道詞對應的觀測狀態下,直接設定轉移概率強制vertibi解碼時通過確定的詞。
這個訓練的目的就是為了把音訊訊號與我們的特徵一一對應,也就是對齊,為後面的識別做準備。
pelhans 語音識別筆記 (五)語音識別 embedded training
嵌入式語音識別
1.粵嵌gec6818開發板介紹 2.粵嵌gec6818平台介紹及其開發板配置 作業系統 心若十年的部落格 csdn部落格 需要語音識別相應的檔案包 1 inc 需要的標頭檔案 lib 函式介面 api cmd.bnf 語法 由自己定義 asr record demo 執行程式 2 執行伺服器 出現...
基於嵌入式Linux的語音識別系統硬軟體設計
1.引言 語言是人類傳播資訊的重要手段,語音識別則是實現語音控制的關鍵技術。採用嵌入式語音識別技術使得裝置具有功耗低 使用簡便 靈活等優點,擺脫了複雜按鍵和按鈕的困擾,在服務機械人 智慧型家居及消費電子等領域發揮著重要作用。2.系統構成與原理 語音識別主要包括兩個階段 訓練階段和識別階段。在訓練或識...
嵌入式開發中串列埠問題
用筆記本,往往沒有串列埠,一般用usb轉串列埠,總結了下,首先一般這個轉換器都是pl2303的,可以在配套的驅動資料夾下看到乙個pl2303.dat的資料夾,就是它了。window下,用dnw或者securecrt,有時會出現不通,或者不能從pc鍵盤輸入,現在就是這樣 這個時候,確認線是接好的,然後...