生成proto和vfloors;
hcompv -c .
/config/config_color -f 0.01 -m -s .
/config/train.scp -m .
/hmm0 .
/config/proto
生成macros:
perl scripts/makemacros hmm0/vfloors hmm0/macros
生成hmmdefs:
perl scripts/makehmmdefs hmm0/proto lists/monophones hmm0/hmmdefs
生成monooffsp:
perl scripts/makemonooffsp .
/lists/monophones .
/lists/monooffsp
依次執行以下命令:
以hmm0為基礎,生成hmm1
herest -c .
/config/config_color -i .
/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .
/config/train.scp -h .
/hmm0/macros -h .
/hmm0/hmmdefs -m .
/hmm1/
./lists/monooffsp
以hmm1為基礎,生成hmm2
herest -c .
/config/config_color -i .
/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .
/config/train.scp -h .
/hmm1/macros -h .
/hmm1/hmmdefs -m .
/hmm2/
./lists/monooffsp
以hmm2為基礎,生成hmm3
herest -c .
/config/config_color -i .
/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .
/config/train.scp -h .
/hmm2/macros -h .
/hmm2/hmmdefs -m .
/hmm3/
./lists/monooffsp
在hmm1、hmm2、hmm3目錄下都會生成macros和hmmdefs
獲得hmm4目錄下hmmdefs檔案:
perl .
/scripts/fixsil hmm3/hmmdefs hmm4/hmmdefs
複製hmm3目錄下macros至hmm4目錄下:
cp hmm3/macros .
/hmm4/macros
編輯sil.hed檔案,並置於config目錄下,sil.hed內容如下
at 2 4 0.2
at 4 2 0.2
at 1 3 0.3
ti silst
執行命令:
hhed -h .
/hmm4/macros -h .
/hmm4/hmmdefs -m hmm5/ config/sil.hed .
/lists/monophones
ex
is sil sil
執行命令:
hled -l '*'
-d .
/dict/dict_color -i .
/labels/phones_color.mlf .
/config/mkphones_color_hled.led .
/labels/trainwords.mlf
以hmm5為基礎,生成hmm6
herest -c .
/config/config_color -i .
/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .
/config/train.scp -h .
/hmm5/macros -h .
/hmm5/hmmdefs -m .
/hmm6/
./lists/monophones
以hmm6為基礎,生成hmm7
herest -c .
/config/config_color -i .
/labels/phones_color.mlf -t 250.0 150.0 1000.0 -s .
/config/train.scp -h .
/hmm6/macros -h .
/hmm6/hmmdefs -m .
/hmm7/
./lists/monophones
到此訓練模型結束,會在hmm-hmm7下分別有hmmdefs和macros檔案生成。 語音識別之HTK入門(三) 單音素單高斯模型
前面兩節介紹了語音識別的一些概念,並進行資料的預處理。現在我們有了音訊資料轉化為mfcc特徵向量的檔案,以及與每個特徵檔案相對應的音素資訊檔案。現在進入模型構建部分,包括兩個核心部分,一是如何表示音素概率分布 二是如何建模音素間的轉移關係。首先,給個總結性的描述。最初的系統是通過隱馬爾可夫模型 hm...
語音識別工具箱HTK 識別yes 和no
前言 這個htk真心麻煩 真的要學一學怎麼寫乙個指令碼,自動執行這麼多的步驟了 識別效果真的不咋地吧 我發現自己寫的blog 被覆蓋了 很生氣 csdn 的匯出功能不能匯出這是什麼鬼 沒有備份真是乙個巨大的錯誤!參考文獻 官方的文件 htk 基礎指南 特別鳴謝 孫大佬 6.建立hmm模型 7.對模型...
語音識別入門筆記
語音識別數學表示 argmax p w o argmax p o w p w w 輸出的文字序列 o 輸入的語音波形序列 語音識別兩大組成部分 1 p o w 在給定的文字序列下,模型生成語音波形序列的概率 稱為聲學模型 acoustic model 佔據主要的計算任務 2 p w 表示輸出w文字序...