實驗目的
1、熟練運用matlab軟體進行語音頻號實驗;
2、熟悉短時分析原理、mfcc的原理;
3、學習運用matlab程式設計進行mfcc的提取;
4、學會利用短時分析原理提取mfcc特徵序列;
實驗原理
mfcc:
語音識別和說話人識別中,常用的語音特徵是基於mel頻率的倒譜係數(即mfcc)。mfcc引數是將人耳的聽覺感知特性和語音的產生機制相結合。 mel頻率可以用如下公式表示:
在實際應用中,mfcc倒譜係數計算過程如下;
① 將訊號進行分幀,預加重和加漢明窗處理,然後進行短時傅利葉變換並得到其頻譜。
② 求出頻譜平方,即能量譜,並用m個mel帶通濾波器進行濾波;由於每乙個頻帶中分量的作用在人耳中是疊加的。因此將每個濾波器頻帶內的能量進行疊
加,這時第k個濾波器輸出功率譜)('
kx。
③ 將每個濾波器的輸出取對數,得到相應頻帶的對數功率譜;並進行反離散余弦變換,得到l個mfcc係數,一般l取12~16個左右。mfcc係數為
實驗過程(步驟)
① 輸入樣本音訊
② 給樣本音訊預加重、分幀、加窗
③ 將處理好的樣本音訊做傅利葉變換
④ 進行mel頻率濾波
⑤ 進行log對數能量
⑥ 對樣本求倒譜
⑦ 輸出mfcc影象
MFCC倒譜係數特徵提取與識別
耳蝸實質上相當於乙個濾波器組,耳蝸的濾波作用是在對數頻率尺度上進行的,在1000hz下,人耳的感知能力與頻率成線性關係 而在1000hz以上,人耳的感知能力與頻率不構成線性關係,而更偏向於對數關係,這就使得人耳對低頻訊號比高頻訊號更敏感。mel頻率的提出是為了方便人耳對不同頻率語音的感知特性的研究。...
畢設 梅爾倒譜係數 MFCC特徵提取
一 mfcc概述 在語音識別 speechrecognition 和話者識別 speakerrecognition 方面,最常用到的語音特徵就是梅爾倒譜係數 mel scalefrequency cepstral coefficients,簡稱mfcc 一般來說,低音容易掩蔽高音,而高音掩蔽低音較困...
特徵工程 特徵提取
特徵提取 將任意資料 如文字或影象 轉換為可用於機器學習的數字特徵 注 特徵值化是為了計算機更好的去理解資料 字典特徵提取 作用 對字典資料進行特徵值化 dictvectorizer.get feature names 返回類別名稱 from sklearn.feature extraction i...