雜訊抑制在遠場語音識別和通話中的應用

2022-01-09 23:26:59 字數 568 閱讀 9726

對帶噪語音做雜訊抑制,在遠場語音識別和通話中都會用到,也都會碰到乙個矛盾,是盡量的消除雜訊即便對語音有損傷,還是盡量的不損傷語音即便保留一些雜訊呢?

筆者這些年,接觸了不少語音識別行業和通話行業的人,大家都在說,我們是兩個行業,雖然雜訊抑制的原理差不多,但是乙個是給機器聽的,乙個是個人聽的。

那麼具體有什麼不同呢?

語音識別行業的說,我們不需要降那麼乾淨,不能損傷語音,否則會影響識別的效果。你們通話行業,可以降得狠一些,反正人的糾錯能力很強,對語音損傷一點關係不大。

而通話行業的說,我們是給人聽的,舒適度最重要,寧可雜訊多留一點,也不能損傷語音。你們識別行業,可以降得狠一些,反正給機器聽,能識別出來就行。

哈哈,兩個行業對對方的認知竟然有這麼大差異,不知不覺中竟然走到了一條路線上來,最終結果呢?都是希望不損傷語音。

其實語音識別行業和通話行業,對降噪的最大差別是:是不是要求按幀實時處理。

語音識別行業根據使用場景,是可以積累一定的資料量再處理的,而通話行業,則必須是按幀實時處理。

加上這個限定,通話行業對雜訊抑制的演算法要求更苛刻一些,在語音識別行業可以用的方法,改成按幀實時後,效果往往會打折扣。

遠場語音技術簡介 001

遠場語音系統架構 遠場語音系統由前端語音處理模組和後端語音識別模組組成,目前商用的語音識別系統都是基於統計原理設計,如上面框圖所示,聲學模型用於表述聲學 麥克風 環境多樣性等可變因素,語言模型表述語言學角度定義的詞語組合方式及邏輯順序,與解碼器的應用介面用於將識別結果更好的適配到系統其他模組。典型的...

語音識別 干擾抑制 揭秘語音系統裡的麥克風陣列

就是 傳聲器陣列 主要由一定數目的聲學感測器組成,用來對聲場的空間特性進行取樣並處理的系統。麥克風陣列語音處理系統 而這裡講到的麥克風陣列是其中乙個狹義概念,特指應用於語音處理的按一定規則排列的多個麥克風系統,也可以簡單理解為2個以上麥克風組成的錄音系統。麥克風陣列一般來說有線形 環形和球形之分,嚴...

在ROS中使用語音識別和語音合成

執行測試平台 小強ros機械人 語音識別是乙個很常見的技術,ros中也有一些語音識別的功能包,但是效果都不太好。沒有實時識別的功能。對於科大迅飛ros的支援也很不好。為了解決這些問題於是就有了下面的軟體包 xiaoqiang tts。cd 到你的工作空間的src資料夾中 git clone git ...