即y(z)=x(z).h(z).以最小化**誤差為目標優化係數a,就可以得到特徵係數。通常採用自相關方法,利用durbin演算法求解方程。這裡給出引數計算公式:
2) 濾波器還有乙個反射係數,可以理解為聲道的反射係數,和**誤差e,初始化為r0,設和是i-1階濾波器的反射係數和**係數,關於i階濾波器的反射係數和**係數可以通過三個步驟求得:
5、這樣就得到了p個**係數,我們也可以用p個反射係數ki,i=1,p當做特徵。在htk中設定引數為:
另外,也可以求**倒譜係數作為特徵。推導如下:
用倒譜係數是因為使用dct變換,將係數去相關,那麼就可以利用對角協方差矩陣去描述狀態的高斯分布。倒譜特徵的維數應與**係數個數相同,htk中有引數numceps設定。
plp(perceptual linear predict ive,感知線性**):是一種基於聽覺模型的特徵引數。該特徵引數是全極點模型**多項式的一組係數[ 2] ,等效於一種lpc( linear pr edict ion coef f icient , 線性**係數) 特徵。它們的不同之處是plp 技術將人耳聽覺試驗獲得的一些結論, 通過近似計算的方法進行了工程化處理, 應用到頻譜分析中, 將輸入的語音頻號經聽覺模型處理後所得到的訊號替代傳統的lpc 分析所用的時域訊號。經過這樣處理後的語音頻譜考慮到了人耳的聽覺特點, 因而有利於抗噪語音特徵提取。
plp 技術主要在三個層次上模仿了人耳的聽
覺感知機理:
1) 臨界頻帶分析處理;
2) 等響度曲線預加重;
3) 訊號強度- 聽覺響度變換。
plp 特徵提取步驟如圖所示。
1 頻譜分析
語音頻號經過取樣、加窗、離散傅利葉變換後,
取短時語音頻譜的實部和虛部的平方和, 得到短時
功率譜p ( f ) = rx [ x ( f ) ]2 + i m [ x ( f ) ]2 ------ ( 1)
2 臨界頻帶分析
臨界頻帶的劃分反映了人耳聽覺的掩蔽效應,
是人耳聽覺模型的體現。利用公式
z( f ) = 6ln------- ( 2)
將頻譜p ( f ) 的頻率軸f 對映到bark 頻率z, 總共
得到17 個頻帶。
這17 個頻帶中每個頻帶內的能量譜與式( 3) 的加權係數相乘, 求和後得到臨界頻寬聽覺譜θ( k) 。
其中z0 ( k ) 表示第k 個臨界帶聽覺譜的中心頻率.
3 等響度預加重
用模擬人耳大約40 db 等響曲線e( f ) 對θ( k)
進行等響度曲線預加重, 即
γ( k) = e[f0(k)]θ( k) , ( k = 1, 2, ..., 17) ------ ( 5)
f0 ( k ) 表示第k 個臨界帶聽覺譜的中心頻率所對應的頻率( 單位為hz) 。其中
e[ f0(k)] =(f0(k)2 + 1. 44 * 106 )f0(k)4/( f0(k)2 + 1.6*105)2*( f0( k)2 + 9.61*109)------ ( 6)
4 強度-響度轉換
為了近似模擬聲音的強度與人耳感受的響度間的非線性關係, 進行強度-響度轉換
θ(k) = γ( k )0.33 ------- ( 7)
經過離散傅利葉反變換後, 用德賓演算法計算12階全極點模型, 並求出16 階倒譜係數, 最後的結果即為plp 特徵引數。
參考文獻:雜訊條件下的語音特徵plp 引數的提取;魏 豔, 張雪英;太原理工大學學報第40卷第3期。
邊緣特徵提取方法
邊緣檢測是圖形影象處理 計算機視覺和機器視覺中的乙個基本工具,通常用於特徵提取和特徵檢測,旨在檢測一張數字影象中有明顯變化的邊緣或者不連續的區域,在一維空間中,類似的操作被稱作步長檢測 step detection 邊緣是一幅影象中不同屈原之間的邊界線,通常乙個邊緣影象是乙個二值影象。邊緣檢測的目的...
邊緣特徵提取方法
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!邊緣檢測是圖形影象處理 計算機視覺和機器視覺中的乙個基本工具,通常用於特徵提取和特徵檢測,旨在檢測一張數字影象中有明顯變化的邊緣或者不連續的區域,在一維空間中,類似的操作被稱作步長檢測 step detection 邊緣是一幅影象中不同屈原之間的邊...
特徵提取方法 one hot 和 TF IDF
one hot 和 tf idf是目前最為常見的用於提取文字特徵的方法,本文主要介紹兩種方法的思想以及優缺點。什麼是one hot編碼?one hot編碼,又稱獨熱編碼 一位有效編碼。其方法是使用n位狀態暫存器來對n個狀態進行編碼,每個狀態都有它獨立的暫存器位,並且在任意時候,其中只有一位有效。舉個...