在工程專案中,有一天專案組說我們做語音評測的不需要這麼多音素來表示,我們的產品英語語音評測是參考libirispeech中的指令碼來修改的,預設是有360多個音素來表示的,檢視phones.txt檔案中,發現實際上音素包含有位置資訊。
kaldi中修改音素個數,將指令碼中prepare_lang.sh中設定position-dependent-phones false 即可。
修改之後跑出來的phones.txt檔案只有90個音素了。
Kaldi 中CMVN處理過程
author xin pan date 2020.01.03 因為一直好奇cmvn cepstral mean and variance normalization,倒譜均值方差歸一化 是怎麼處理的,正好在伺服器安上了gdb就跟著單步除錯了一下。先看下kaldi官網對於cmvn的解釋,以下內容來自c...
Kaldi中的L2正則化
steps nnet3 train dnn.py l2 regularize factor 影響模型引數的l2正則化強度的因子。要進行l2正則化,主要方法是在配置檔案中使用 l2 regularize 進行配置。l2正則化因子將乘以元件中的l2正則化值,並且可用於通過模型平均化以校正與並行化帶來的影...
kaldi中SHELL呼叫C 程式過程原始碼分析
kaldi真正的核心原始碼,都是c 寫成的,這個結論可以從如下兩點得以確認 1 在kaldi的原始碼kaldi src目錄下,能看到很多擴充套件名為.cc的源程式,這是linux下c 原始碼 2 在原始碼中,比如kaldi src featbin compute mfcc feats.cc,可以看到...