語音增強原理之增益因子

2021-07-27 13:35:42 字數 2574 閱讀 9652

上次關於語音增強的原理講說了雜訊估計問題,這次打算說下增益因子如何確定,也就是當雜訊已知後,如何進行去噪的問題(把增益因子與帶噪語音相乘即可)。這裡主要說下mmse濾波,順帶說下譜減法、維納濾波。當然也有其它方式來實現語音增強的,比如基於矩陣分解原理的子空間法、基於自適應濾波器的降噪,有的方法icoolmedia比較清楚,有的也還在學習之中,同時也歡迎各位朋友就不足之處批評指正。

先說下經典的譜減法。我們還是假設帶噪語音y(n)由純淨語音x(n)和加性雜訊d(n)組成,其時域表示與頻域表示為 y

(n)=

x(n)

+d(n

)y(ω

)=x(

ω)+d

(ω)

在語音增強領域中,最常使用的是頻域功率譜形式,那麼,帶噪語音的功率譜可以表示為y與其共軛相乘,展開可得 |

y(ω)

|2=[

x(ω)

+d(ω

)][x

∗(ω)

+d∗(

ω)]=

|x(ω

)|2+

|d(ω

)|2+

x(ω)

d∗(ω

)+x∗

(ω)d

(ω)=

|x(ω

)|2+

|d(ω

)|2+

2re展開式的第三項被稱為交叉項,當純淨語音與加性雜訊不相關時,交叉項為0,那麼,當我們已經估計出雜訊訊號的功率譜時,純淨語音頻號的估值就可以表示為 |

x^(ω

)|2=

|y(ω

)|2−

|d^(

ω)|2

根據線性濾波理論,可以將這個濾波過程建模為 |

x^(ω

)|2=

h2(ω

)|y(

ω)|2

綜合以上兩式,h可以表示為 h

(ω)=

|x^(

ω)|2

|y(ω

)|2−

−−−−

−−⎷

=|

y(ω)

|2−|

d^(ω

)|2|

y(ω)

|2−−

−−−−

−−−−

−−−−

⎷

=1−|

d^(ω

)|2|

y(ω)

|2−−

−−−−

−−−−

⎷

這裡的h,就是線性濾波系統的傳遞函式,在語音增強領域,通常也稱為增益函式/抑制函式、或者增益因子/抑制因子,都是是同乙個意思。另外,要注意,上面的這個增益因子表示只是乙個理想的過程。因為當從帶噪語音中減去估計雜訊後,總會遺留一些或長或短的小譜峰,這些譜峰比較影響聽感。這種現象就是出現了**雜訊。因此,如果譜減法要實際使用時,必須做如下改變。

經過這兩方面的改變,譜減法具有如下形式: |

x^(ω

)|2=

p(xx

,θk)

=xkπ

λk(k

)exp

代入mmse估計器中,我們最終得到mmse幅度譜估計器(推導過程請參考:語音增強-理論與實踐中的附錄b) x

^k=v

k−−√

γkγ(

1.5)φ(

−0.5,1

;−vk

)yk

其中,γ(.)為伽馬函式,φ(a,b;c)為合流超幾何函式,ξ為先驗訊雜比、最後乙個式子為後驗訊雜比。 v

k=ξk

1+ξk

γkξk

=λx(

k)λd

(k)γ

k=y2

kλd(

k)最後,把合流超幾何函式寫成貝塞爾函式的形式,我們就得到了最終的mmse估計器的表示式: x

^k=π

√2vk

−−√γ

kexp(−

vk2)

[(1+

vk)i

0(vk

2)+v

ki1v

k2]y

k

如果我們定義: g

(ξk,

γk)=

x^ky

k=π√

2vk−

−√γk

exp(−v

k2)[

(1+v

k)i0

(vk2

)+vk

i1vk

2]的話,這裡g就是我們要求的mmse幅度估計器的增益。

另外想說一下,mmse估計的推導思路我弄明白了,主要是通過參考《語音增強-理論與實踐》、《統計訊號處理基礎-估計與檢測理論》這兩本書做到的,但關於合流超幾何函式與貝塞爾函式的推導內容還沒完全搞明白,如果不是對理論推導過程非常感興趣的話,這裡也沒有必要深究,只要會使用這個結果就行了。

使用mmse做語音增強,經典的出處應該是speech enhancement using minimum mean-square error這篇**,但裡面講的並不詳細,這裡盡可能的給出能讓大家理解流程的推導。當然,如果感興趣的話,icoolmedia還是推薦大家最好都認真看一遍上面提到的資料。

DNN語音增強實現

獲取乾淨語音及雜訊語音資料,可以使用 sou ndfi le soundfile soundf ile 中的 rea dread read 函式 處理語音資料,主要是因為雜訊和乾淨語音的長度不一致,而對乾淨語音加噪時,需要保證雜訊和乾淨語音的長度一致,以防資料處理時,陣列不一致,因此需要選取與乾淨語...

語音增強國外牛人

1 傳統單通道的語音增強方法 yariv ephraim 主頁 此人大牛,可以說開啟 總結 了語音增強的三個方向,statiscial model based,hmm training based,subspace based.rainer martin 主頁 主要貢獻在於noise power e...

語音增強的幾個基本演算法

前言 1 單通道語音增強 主要是 語音增強 書籍內容的梳理 內容會持續更新,內容為個人的理解,如果存在偏差或者錯誤的地方,還希望各位幫忙指出來。一 單通道語音增強 選讀 speech enhancement theory and practice 主要是自己的讀書筆記.第一章 第四章,主要介紹語音增...