語音端點檢測,通常是指在有雜訊或其他干擾的環境下分辨出音訊訊號流
中的語音頻號和非語音頻號,並確定語音頻號的起始點和終止點,為後續
的訊號處理提供必要的支援。但在實際應用中,由於雜訊的引入、環境的
改變甚至是語音自身的性質都會導致端點檢測的結果不準確,系統的識別
效能也不能得到保證。由於現實環境下沒有完全純淨的語音頻號,往往都
伴有雜訊或其他干擾,通常會使端點檢測效能顯著地下降。由於實際應用
中的語音採集於不同的場景中,常常會混入不同型別的環境噪音,這增加
了語音端點檢測的難度,並降低了語音端點檢測的準確性。
系統展示了當前主要語音端點檢測演算法的檢測效能。
fs=handles.fs;
is=0.25; % 設定前導無話段長度
wlen=200; % 設定幀長為25ms
inc=80; % 求幀移
xx=xx-mean(xx); % 消除直流分量
x=xx/max(abs(xx)); % 幅值歸一化
n=length(x); % 取訊號長度
time=(0:n-1)/fs; % 設定時間
wnd=hamming(wlen); % 設定窗函式
overlap=wlen-inc; % 求重疊區長度
nis=fix((is*fs-wlen)/inc +1); % 求前導無話段幀數
y=enframe(x,wnd,inc)』; % 分幀
fn=size(y,2); % 求幀數
frametime=frame2time(fn, wlen, inc, fs);% 計算各幀對應的時間
% bark子帶參數列
fk=[50 20 100; 150 100 200; 250 200 300; 350 300 400; 450 400 510; 570 510 630; 700 630 770;…
840 770 920; 1000 920 1080; 1170 1080 1270; 1370 1270 1480; 1600 1480 1720; 1850 1720 2000;…
2150 2000 2320; 2500 2320 2700; 2900 2700 3150; 3400 3150 3700; 4000 3700 4400;…
4800 4400 5300; 5800 5300 6400; 7000 6400 7700; 8500 7700 9500; 10500 9500 12000;…
13500 12000 15500; 18775 15500 22050];
% 插值
基於MATLAB GUI 的多演算法語音增強系統
語音增強是指當語音頻號被各種各樣的雜訊干擾 甚至淹沒後,從雜訊背景中提取有用的語音頻號,抑制 降低雜訊干擾的技術。一句話,從含噪語音中提取盡可能純淨的原始語音。實際語音遇到的干擾可以分以下幾類 週期性雜訊,例如電氣干擾,發動機旋轉部分引起的干擾等,這類干擾表現為一些離散的窄頻峰 衝激雜訊,例如 些電...
極限元語音演算法專家劉斌 基於深度學習的語音生成問題
一 深度學習 在語音合成中的應用 語音合成主要採用波形拼接合成和統計引數合成兩種方式。波形拼接語音合成需要有足夠的高質量發音人錄音才能夠合成高質量的語音,它在工業界中得到了廣泛使用。統計引數語音合成雖然整體合成質量略低,但是在發音人語料規模有限的條件下,優勢更為明顯。在上一期我們重點介紹了深度學習在...
基於matlab的隨機取樣計算法
對於線性規劃而言,有著成熟且有效的方法,而對於非線性整數規劃而言,沒有通解,儘管限制變數為整數而增加了難度,然而整數解為有限個,於是可以用列舉法求解方案。當然在乙個自變數維度很大和取值範圍很寬的情況下,企圖用窮舉法計算最優值是不現實的,但是根據概率理論可知,完全可以得出乙份滿意解。下面是matlab...