2 使用原文提供的聲學模型和語言模型測試結果,
資料標籤整理在data
路徑下,其中primewords、st-cmd目前未區分訓練集測試集。
若需要使用所有資料集,只需解壓到統一路徑下,然後設定utils.py中datapath的路徑即可。
我測試時只使用了thches30語音庫,解壓到data資料夾,修改如下
def data_hparams():
params = tf.contrib.training.hparams(
# vocab
data_type = 'train',
data_path = 'data/',
thchs30 = true,
aishell = false,
prime = false,
stcmd = false,
batch_size = 1,
data_length = 10,
shuffle = false)
return params
如果修改data_length,執行test.py時會出現如下錯誤,即提供好的訓練模型與測試引數不一致
valueerror: dimension 1 in both shapes must be equal, but are 1042 and 230. shapes are [256,1042] and [256,230]. for 'assign_62' (op: 'assign') with input shapes: [256,1042], [256,230].
由於採用xshell遠端終端控制,在輸出結果時出現
unicodeencodeerror: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128)
這時可採用如下**控制輸出格式
執行train.py訓練自己資料
1 首先需要刪除原來的聲學模型和語言模型,不然訓練會報錯
2 訓練時將atch_size: batch_size設為1 ,data_length設為none,出現keyerror: 'val_acc'
**中未發現val_acc,將
ckpt = "model_-.hdf5"中的va_acc刪去
3 生成聲學模型時出現錯誤
unable to open file (unable to open file: name = './model/char_judgement.h5', errno = 2, error message = 'no such file or directory'
自己建立乙個資料夾存放checkpoint檔案
3 出現訓練集損失函式下降,驗證集損失函式上公升的問題,未解決
基於語音的情緒識別系統(Python)
源 連線 emotion recognition using speech 原鏈結是給的原始的版本,我在 win10 上執行會報錯,比如下邊的的 pyauto 無法安裝的問題。我已經將相應的安裝包上傳到 gitee 上了。碼雲位址 語音情緒識別 在 emotion recognition using...
語音識別系統搭建
搭建語音識別實驗記錄 pip 快速安裝 國內清華源 命令 pip install i 庫名 阿里映象安裝tensorflow pip install i tensorflow gpu 1.13.1語音識別系統 別人的部落格中找到可能出現的問題所在,應該設定gpu按需分配,再看本系統的執行檔案。起初,...
基於HTK的連續語音識別系統搭建學習筆記(一)
該系統能夠識別連續說出的數字串和若干組姓名。建模是針對子詞 sub word,eg.音素 具有一定的可擴充性。當加入乙個新名字時,只需修改發音字典和任務語法即可。模型為連續混合高斯輸出,運用語音決策樹聚類形成的繫結狀態式三音素。1.資料準備 需要錄製訓練資料和測試資料。為進行校準,還需要資料的標註文...