基於深度學習的中文語音識別系統框架學習筆記

2021-09-12 11:33:39 字數 1521 閱讀 2111

2 使用原文提供的聲學模型和語言模型測試結果,

資料標籤整理在data路徑下,其中primewords、st-cmd目前未區分訓練集測試集。

若需要使用所有資料集,只需解壓到統一路徑下,然後設定utils.py中datapath的路徑即可。

我測試時只使用了thches30語音庫,解壓到data資料夾,修改如下

def data_hparams():

params = tf.contrib.training.hparams(

# vocab

data_type = 'train',

data_path = 'data/',

thchs30 = true,

aishell = false,

prime = false,

stcmd = false,

batch_size = 1,

data_length = 10,

shuffle = false)

return params

如果修改data_length,執行test.py時會出現如下錯誤,即提供好的訓練模型與測試引數不一致

valueerror: dimension 1 in both shapes must be equal, but are 1042 and 230. shapes are [256,1042] and [256,230]. for 'assign_62' (op: 'assign') with input shapes: [256,1042], [256,230].

由於採用xshell遠端終端控制,在輸出結果時出現

unicodeencodeerror: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128)

這時可採用如下**控制輸出格式

執行train.py訓練自己資料

1 首先需要刪除原來的聲學模型和語言模型,不然訓練會報錯

2 訓練時將atch_size: batch_size設為1 ,data_length設為none,出現keyerror: 'val_acc' 

**中未發現val_acc,將

ckpt = "model_-.hdf5"中的va_acc刪去

3 生成聲學模型時出現錯誤

unable to open file (unable to open file: name = './model/char_judgement.h5', errno = 2, error message = 'no such file or directory'

自己建立乙個資料夾存放checkpoint檔案

3 出現訓練集損失函式下降,驗證集損失函式上公升的問題,未解決

基於語音的情緒識別系統(Python)

源 連線 emotion recognition using speech 原鏈結是給的原始的版本,我在 win10 上執行會報錯,比如下邊的的 pyauto 無法安裝的問題。我已經將相應的安裝包上傳到 gitee 上了。碼雲位址 語音情緒識別 在 emotion recognition using...

語音識別系統搭建

搭建語音識別實驗記錄 pip 快速安裝 國內清華源 命令 pip install i 庫名 阿里映象安裝tensorflow pip install i tensorflow gpu 1.13.1語音識別系統 別人的部落格中找到可能出現的問題所在,應該設定gpu按需分配,再看本系統的執行檔案。起初,...

基於HTK的連續語音識別系統搭建學習筆記(一)

該系統能夠識別連續說出的數字串和若干組姓名。建模是針對子詞 sub word,eg.音素 具有一定的可擴充性。當加入乙個新名字時,只需修改發音字典和任務語法即可。模型為連續混合高斯輸出,運用語音決策樹聚類形成的繫結狀態式三音素。1.資料準備 需要錄製訓練資料和測試資料。為進行校準,還需要資料的標註文...