基於深度學習的中文語音識別系統框架學習筆記

2 使用原文提供的聲學模型和語言模型測試結果，

資料標籤整理在data路徑下，其中primewords、st-cmd目前未區分訓練集測試集。

若需要使用所有資料集，只需解壓到統一路徑下，然後設定utils.py中datapath的路徑即可。

我測試時只使用了thches30語音庫，解壓到data資料夾，修改如下

def data_hparams():
params = tf.contrib.training.hparams(
# vocab
data_type = 'train',
data_path = 'data/',
thchs30 = true,
aishell = false,
prime = false,
stcmd = false,
batch_size = 1,
data_length = 10,
shuffle = false)
return params

如果修改data_length，執行test.py時會出現如下錯誤，即提供好的訓練模型與測試引數不一致

valueerror: dimension 1 in both shapes must be equal, but are 1042 and 230. shapes are [256,1042] and [256,230]. for 'assign_62' (op: 'assign') with input shapes: [256,1042], [256,230].

由於採用xshell遠端終端控制，在輸出結果時出現

unicodeencodeerror: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128)

這時可採用如下**控制輸出格式

執行train.py訓練自己資料

1 首先需要刪除原來的聲學模型和語言模型，不然訓練會報錯

2 訓練時將atch_size: batch_size設為1 ，data_length設為none，出現keyerror: 'val_acc'

**中未發現val_acc，將

ckpt = "model_-.hdf5"中的va_acc刪去

3 生成聲學模型時出現錯誤

unable to open file (unable to open file: name = './model/char_judgement.h5', errno = 2, error message = 'no such file or directory'

自己建立乙個資料夾存放checkpoint檔案

3 出現訓練集損失函式下降，驗證集損失函式上公升的問題，未解決

基於語音的情緒識別系統（Python）

源連線 emotion recognition using speech 原鏈結是給的原始的版本，我在 win10 上執行會報錯，比如下邊的的 pyauto 無法安裝的問題。我已經將相應的安裝包上傳到 gitee 上了。碼雲位址語音情緒識別在 emotion recognition using...

語音識別系統搭建

搭建語音識別實驗記錄 pip 快速安裝國內清華源命令 pip install i 庫名阿里映象安裝tensorflow pip install i tensorflow gpu 1.13.1語音識別系統別人的部落格中找到可能出現的問題所在，應該設定gpu按需分配，再看本系統的執行檔案。起初，...

基於HTK的連續語音識別系統搭建學習筆記（一）

該系統能夠識別連續說出的數字串和若干組姓名。建模是針對子詞 sub word,eg.音素具有一定的可擴充性。當加入乙個新名字時，只需修改發音字典和任務語法即可。模型為連續混合高斯輸出，運用語音決策樹聚類形成的繫結狀態式三音素。1.資料準備需要錄製訓練資料和測試資料。為進行校準，還需要資料的標註文...

基於深度學習的中文語音識別系統框架學習筆記

基於語音的情緒識別系統（Python）

語音識別系統搭建

基於HTK的連續語音識別系統搭建學習筆記（一）

相關推薦