語音增強是指當語音頻號被各種各樣的雜訊干擾、甚至淹沒後,從雜訊背景中提取有用的語音頻號,抑制、降低雜訊干擾的技術。一句話,從含噪語音中提取盡可能純淨的原始語音。
實際語音遇到的干擾可以分以下幾類:①週期性雜訊,例如電氣干擾,發動機旋轉部分引起的干擾等,這類干擾表現為一些離散的窄頻峰;②衝激雜訊,例如-些電火花、放電產生的雜訊干擾;③寬頻雜訊,這是指高斯雜訊或白雜訊一類的雜訊,它們的特點是頻帶寬,幾乎覆蓋整個語音頻帶;④語音干擾,例如話筒中拾入其它人的說話,或者傳輸時遇到串音引起的語音。對付上述各種不同型別的雜訊,增強技術亦是不一樣的。
語音增強的乙個主要目標是從帶噪語音頻號中提取盡可能純淨的原始語音。然而,由於干擾通常都是隨機的,從帶噪語音中提取完全純淨的語音幾乎不可能。在這種情況下,語音增強的目的主要有兩個:一是改進語音質量,消除背景噪音,使聽者樂於接受,不感覺疲勞,這是一種主觀度量;二是,這是一種客觀度量。這兩個目的往往不能兼得。目前有一些對低訊雜比帶噪語音進行語音增強的方法,可以顯著地降低背景雜訊,改進語音質量,但並不能提高語音的可懂度,甚至略有下降。
語音增強不但與語音頻號數字處理理論有關,而且涉及到人的聽覺感知和語音學範疇。再者,雜訊的**眾多,因應用場合而異,它們的特性也各不相同。所以必須針對不同雜訊,採用不同的語音增強對策。某些語音增強演算法在實際應用中己經證明是有效的,它們大體上可分為四類:雜訊對消法、諧波增強法、基於引數估計的語音再合成法和基於語音短時譜估計的增強演算法。
unction [pxx] = pwelch_2(x, nwind, noverlap, w_nwind, w_noverlap, nfft)
% 計算短時功率譜密度函式
% x是訊號,nwind是每幀長度,noverlap是每幀重疊的樣點數
% w_nwind是每段的窗函式,或相應的段長,
% w_noverlap是每段之間的重疊的樣點數,nfft是fft的長度
x=x(?;
inc=nwind-noverlap; % 計算幀移
x=enframe(x,nwind,inc)』; % 分幀
framenum=size(x,2); % 計算幀數
%用pwelch函式對每幀計算功率譜密度函式
基於MATLAB GUI的系統設計(一)
圖形使用者介面gui graphics user inte ce 是基於matlab軟體人機交流資訊的工具和平台,由圖形視窗 下拉列表 按鈕 文字框等控制項構建而成,是開發者與使用者之間的紐帶。它為使用者和程式之間提供了良好的互動方式,使用者僅通過滑鼠 鍵盤等簡單的輸入裝置即可與計算機複雜的程式檔案...
基於MATLAB GUI的指紋識別系統
指紋識別的第一步是指紋圖像的獲取,目前已經有多種指紋圖像的獲取方式,主要有光學指紋採集技術 電容式感測器指紋採集 溫度感測指紋獲取技術 超聲波指紋採集技術 電磁波指紋採集技術,獲得影象後進行預處理加工,要實現影象的灰度變換 分割 均衡化 增強 細化等預處理步驟。首先要把指紋從整個圖案上分割出來,背景...
基於MATLAB的多演算法語音端點檢測系統
語音端點檢測,通常是指在有雜訊或其他干擾的環境下分辨出音訊訊號流 中的語音頻號和非語音頻號,並確定語音頻號的起始點和終止點,為後續 的訊號處理提供必要的支援。但在實際應用中,由於雜訊的引入 環境的 改變甚至是語音自身的性質都會導致端點檢測的結果不準確,系統的識別 效能也不能得到保證。由於現實環境下沒...