介紹一種音訊訊號分類方法

2021-08-11 19:11:42 字數 1359 閱讀 6156

能用來區分語音和**訊號的音訊特徵有很多種,如感覺特性、能量、功率譜和mel頻標倒譜(mfcc)係數,能量、平均過零率、基頻和功率譜峰值等。以下介紹一種基於子帶音調個數比與頻譜傾斜度相結合的區分方法。

一、基本原理

不同型別的音訊,其音調分量在各個子帶的分布有所不同。語音的音調分量絕大部分分布在低頻處,而**的音調分量在各個子帶的分布則相對較均勻。利用該特性可區分**與語音頻號。

由於某些敲打式的突變**訊號,其音調分布特性較接近於語音的音調分布特性。因此僅用子帶音調分量區分準確度不高。為解決這一問題,引入頻譜傾斜度特徵。一般來說,語音與**的平均頻譜傾斜度主要分布在[0.650,0.995]的範圍內,但對於一些敲打式的突變**訊號,其頻譜傾斜度的值很小,小於0.650。另外,有些**頻譜傾斜度的值可達到很高,大於0.995。該特性能較好的區分子帶音調分量不能區分的突變**訊號。

二、方法實現

2.1子帶音調個數比

對訊號進行分幀處理,幀長為n。用漢明窗對每幀輸入時域訊號進行加窗,然後對加窗訊號進行fft變換,並計算其功率密度譜x(k),x(k)也稱為頻譜係數。由於fft是關於n12對稱的n/2,因此只需計算前n/2個頻譜。

將頻域劃分為4個子帶sbi,分別為 [0,n/16],[n/16,n/8],[n/8,n/4]和[n/4,n/2]。當頻譜係數x(k)符合x(k-1)

計算每個子帶的音調個數nti(i=0,1,…,3)與幀的總音調個數ntsum的比值,即子帶音調個數比rti。取當前幀子帶音調個數比與前面l幀(l=20,取1s較合理)的子帶音調個數比的平均值作為當前幀的子帶音調個數比(平滑處理)。語音與**在sb0和sb2的音調分布區別較大,因此可採用rt0與rt2對語音和**進行區分。

2.2  頻譜傾斜度及判斷方法

頻譜傾斜度(st)是估計語音頻號第乙個自相關係數的歸一化值st=r(1)/r(0),其中,r(j)為自相關係數。與子帶音調個數比類似,以20幀為例,計算當前幀與前19幀的st均值作為當前幀的st值。

結合子帶音調個數比和頻譜傾斜度對輸入音訊訊號進行分類。當同時符合rt0>0.62,rt<0.08,st >0.65.而且st<0.995這4個條件時,把當前幀判別為語音;否則,判別 為**。

分類結果有時會出現單幀誤判的情況,即所謂的「毛刺」現象。平滑技術可有效去除這種「毛刺」。平滑的簡單實現方法是:若前乙個資料塊的訊號型別與後乙個資料塊的訊號型別相同。而與當前幀的訊號型別不同時,使當前幀的訊號型別判決為與前乙個資料塊的訊號型別相同。實驗證明,在分類演算法中採用平滑技術可有效去除一些「毛刺」現象,使分類更平滑。

介紹一種學習方法

我們平時在學習的時候總感覺自己的效率不高,別人也花了同樣的時間,為什麼不同的人所得到的效果不一樣。今天介紹一種學習方法,這一方法與費曼有關。先簡單介紹一下費曼。費曼是20世紀著名的理論物理學家,在研製原子彈的曼哈頓計畫中擔任重要角色,曾獲諾貝爾物理學獎。我們很多人都是通過那本充滿幽默感的自傳 別鬧了...

一種asp分頁方法

webpagesize 10 每頁顯示的資訊數量 查表語句 sql select from topic set info server.createobject adodb.recordset info.open sql,conn,1,1 查表語句結束 分頁語句 page intsql reques...

介紹一種洗衣機的使用方法

介紹一種洗衣機的使用方法 今天要介紹的洗衣機洗衣服的步驟和手洗步驟相似 手洗的步驟是在桶中放如要洗的衣服,使用洗衣粉來把衣服洗乾淨,這步在洗衣機中叫洗滌 這時候衣服上還有殘留洗衣粉,我們需要使用清水把殘留洗乾淨,這步在洗衣機中叫漂洗 最後把洗好的衣服擰乾就可以了,這步在洗衣機中叫甩乾。如圖,我們洗衣...