一些語音識別的概念

2021-08-26 18:29:47 字數 473 閱讀 8904

■  呼叫日誌(call logging)

語音識別的呼叫日誌在系統中有著非常重要的作用,該日誌記錄了輸入的音訊、載入的語法、識別過程的中間結果、識別模組呼叫過程、識別使用的各種引數、識別結果以及當時的系統環境資訊。這些資料是效果分析的依據,詳盡的call-log是效果優化的基礎。

■  說話人自適應

當使用者多次使用同一識別系統時,識別引擎能夠逐步適應其口音,使該使用者的識別效果逐步提高。同時,如果預先給定特定說話人的資料,系統可以針對特定說話人進行自適應訓練以獲得更加適合其發音特徵的語音模型,使該說話人在使用系統時,識別效果更好。

■  多槽識別

語音識別的槽(slot)代表乙個關鍵字,即在一次識別中可以識別多個關鍵字,這種識別模式可以提高語音識別的使用效率和使用者體驗。

■  模型自適應

針對每個應用專門優化通用模型從而更加適合應用:包括方言和口音的說話人特徵,無線裝置、voip裝置等通道特徵,詞彙和環境雜訊等應用特徵。

一些關於語音識別和語音情感識別的資源

這些資源要麼就收費很貴,要麼用不了,嗯 但是也花了很長時間收集,先留著吧。基於svm的語音情感識別 matlab gui介面和文件 點這裡!pythonnlp情感識別專案實戰教程 原始碼 資料集 點這裡!python 語音情感分析 搜一搜?基於svm的情感分析系統點這裡!基於svm的語音情感識別系統...

語音中的關於語音識別的一些知識

以下內容都是抄的,哈哈哈 1.mel頻率 是模擬人耳對不同頻率語音的感知。人類對不同頻率語音有不同的感知能力 對1khz以下,與頻率成線性關係,對1khz以上,與頻率成對數關係。頻率越高,感知能力就越差了。因此,在應用中常常只使用低頻mfcc,而丟棄中高頻mfcc。在mel頻域內,人對音調的感知能力...

語音中的關於語音識別的一些知識

以下內容都是抄的,哈哈哈 1.mel頻率 是模擬人耳對不同頻率語音的感知。人類對不同頻率語音有不同的感知能力 對1khz以下,與頻率成線性關係,對1khz以上,與頻率成對數關係。頻率越高,感知能力就越差了。因此,在應用中常常只使用低頻mfcc,而丟棄中高頻mfcc。在mel頻域內,人對音調的感知能力...