在用vad演算法確定靜音和語音資料的開始和起止點之前,需要對語音資料進行處理,然後再計算語音資料的開始和起止點,這個過程稱為資料的預處理,有些vad演算法是基於短時能量和過零率實現的,並不進行預處理操作,但實驗表明,對資料進行預處理之後的效果要比不進行預處理的效果好。這裡,對資料進行去除直流和加窗兩個預處理。
一,去除直流
至少有這幾個理由,要求我們去除直流。
直流,是頻域的慢變成分,一般都是因為訊號採集過程中儀器所致。
如果需要進行頻譜分析,那麼因為直流的頻譜洩漏,會嚴重影響低頻譜的分析。
直流一般不隨時間變化,不反應訊號的趨性。
去除直接**如下:
float new_last_data ,last_data ; // 上次計算的去除直流之後和之前的值。
float *remove_dc(short *data,int frame_size)
return tf;
}
二,加窗
加窗的作用就更明顯了,見 語音頻號的加窗處理
float *hamming(short *data,int frame_size)
return tf;
}
系列二 資料預處理
旨在對資料探勘有個系統的認識,這部分僅僅是對於資料預處理!對於常規的資料預處理主要分為以下4步驟 1 資料清洗 解決缺失值 異常值 離群點的問題 2 資料整合 解決樣本重複 指標構建 屬性高度相似的問題 2 資料規約 解決資料規模過大的問題 4 資料變換 將資料轉化為更方便分析的資料 1 填充缺失值...
php實現資料預處理
建立連線 con new mysqli localhost root root mydb1 檢測連線 if con connect error sql語句 sql insert into user name,password,dob,email values 預處理及繫結 stmt con prep...
資料探勘 (二)資料預處理
1.資料質量的三個要素 準確性 完整性 一致性 2.資料預處理的主要任務 資料清理 資料整合 資料歸約 資料變換 資料清理主要 填補缺失的值,光滑雜訊同時識別離群點,並糾正資料的不一致性。通常是乙個兩步的迭代過程,包括偏差檢測和資料變換 注意 在某些情況下,缺失值並不意味著資料有誤。在理想情況下,每...