語音識別之HTK入門(四)訓練模型

2021-10-02 12:47:13 字數 2668 閱讀 4340

生成proto和vfloors;

hcompv -c .

/config/config_color -f 0.01 -m -s .

/config/train.scp -m .

/hmm0 .

/config/proto

生成macros:

perl scripts/makemacros hmm0/vfloors hmm0/macros
生成hmmdefs:

perl scripts/makehmmdefs hmm0/proto lists/monophones hmm0/hmmdefs
生成monooffsp:

perl scripts/makemonooffsp .

/lists/monophones .

/lists/monooffsp

依次執行以下命令:

以hmm0為基礎,生成hmm1

herest -c .

/config/config_color -i .

/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .

/config/train.scp -h .

/hmm0/macros -h .

/hmm0/hmmdefs -m .

/hmm1/

./lists/monooffsp

以hmm1為基礎,生成hmm2

herest -c .

/config/config_color -i .

/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .

/config/train.scp -h .

/hmm1/macros -h .

/hmm1/hmmdefs -m .

/hmm2/

./lists/monooffsp

以hmm2為基礎,生成hmm3

herest -c .

/config/config_color -i .

/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .

/config/train.scp -h .

/hmm2/macros -h .

/hmm2/hmmdefs -m .

/hmm3/

./lists/monooffsp

在hmm1、hmm2、hmm3目錄下都會生成macros和hmmdefs

獲得hmm4目錄下hmmdefs檔案:

perl .

/scripts/fixsil hmm3/hmmdefs hmm4/hmmdefs

複製hmm3目錄下macros至hmm4目錄下:

cp hmm3/macros .

/hmm4/macros

編輯sil.hed檔案,並置於config目錄下,sil.hed內容如下

at 2 4 0.2   

at 4 2 0.2

at 1 3 0.3

ti silst

執行命令:

hhed -h .

/hmm4/macros -h .

/hmm4/hmmdefs -m hmm5/ config/sil.hed .

/lists/monophones

ex

is sil sil

執行命令:

hled -l '*'

-d .

/dict/dict_color -i .

/labels/phones_color.mlf .

/config/mkphones_color_hled.led .

/labels/trainwords.mlf

以hmm5為基礎,生成hmm6

herest -c .

/config/config_color -i .

/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .

/config/train.scp -h .

/hmm5/macros -h .

/hmm5/hmmdefs -m .

/hmm6/

./lists/monophones

以hmm6為基礎,生成hmm7

herest -c .

/config/config_color -i .

/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .

/config/train.scp -h .

/hmm6/macros -h .

/hmm6/hmmdefs -m .

/hmm7/

./lists/monophones

到此訓練模型結束,會在hmm-hmm7下分別有hmmdefs和macros檔案生成。

語音識別之HTK入門(三) 單音素單高斯模型

前面兩節介紹了語音識別的一些概念,並進行資料的預處理。現在我們有了音訊資料轉化為mfcc特徵向量的檔案,以及與每個特徵檔案相對應的音素資訊檔案。現在進入模型構建部分,包括兩個核心部分,一是如何表示音素概率分布 二是如何建模音素間的轉移關係。首先,給個總結性的描述。最初的系統是通過隱馬爾可夫模型 hm...

語音識別工具箱HTK 識別yes 和no

前言 這個htk真心麻煩 真的要學一學怎麼寫乙個指令碼,自動執行這麼多的步驟了 識別效果真的不咋地吧 我發現自己寫的blog 被覆蓋了 很生氣 csdn 的匯出功能不能匯出這是什麼鬼 沒有備份真是乙個巨大的錯誤!參考文獻 官方的文件 htk 基礎指南 特別鳴謝 孫大佬 6.建立hmm模型 7.對模型...

語音識別入門筆記

語音識別數學表示 argmax p w o argmax p o w p w w 輸出的文字序列 o 輸入的語音波形序列 語音識別兩大組成部分 1 p o w 在給定的文字序列下,模型生成語音波形序列的概率 稱為聲學模型 acoustic model 佔據主要的計算任務 2 p w 表示輸出w文字序...