部分音訊特徵

2021-07-12 02:10:36 字數 937 閱讀 4602



在本資料夾的 low-level features and timbre文字有有對相應的特徵引數代表的物理意義的解釋

來自文獻 全自動中文新聞字幕生成系統的設計與實現

頻譜質心(spectral centroid,sc)頻譜能量的集中點,一般來說,此值越小,說明越多的能量集中在低頻範圍內。

頻譜差分幅度(spectral flux,sf)乙個音訊段中的相鄰兩幀之間譜的平均變化量

頻譜截止頻譜(spectral roll off frequency,srf)把頻率小於等於該值的所有訊號的能量相加,其和為總能量的固定比例(可設定)

頻譜峰度(spectral kurtosis,sk)描述頻率分布曲線形態陡緩程度的統計量

梅爾頻率倒譜係數(mei-frequency cepstral coefficients,mfcc)在梅爾頻率尺度上進行頻譜分析,梅爾頻率尺度與實際頻率關係為 mel(f) =2595lg(1+f/700)。

線性**倒譜係數(linear predictive cepstral coefficients,lpcc)由線性**係數變換得到。線性**的基本思想:用過去的p個樣點值來**未來的樣點值。

短時能量均方值(root-mean-square,rms)一幀的短時能量的均方值

過零率(zero-crossing rate,zcr)一幀中訊號波形穿過橫軸(零電平)的次數

高過零幀比率(high zero-crossing rate ratio,hzcrr)乙個音訊段內過零率超過zcr值的幀數目,zcr值為所有幀的過零率平均值的1.5倍

低能幀比率(low short-time energy ratio,lster)乙個音訊段內能量低於此段內短時能量平均值0.5倍的幀數目

噪音幀比率(noise frame ratio,nfr)乙個音訊段內雜訊幀所佔比例

譜矩(spectral moments,sm)



音訊 一 音訊認知 3 音訊取樣

音訊取樣 首先我們先了解一下過去和現在的音訊錄製原理 錄音 話筒將接收到聲音的波動大小轉化成對應強弱的電流,通過蹄形磁鐵,產生相應的磁性,磁鐵下有勻速通過空隙的磁帶,上面帶有磁粉,磁粉受到不同磁性強度的影響,會聚集在不同的位置,以此來實現對聲音的記錄.音訊數位化 數位化音訊技術是將模擬訊號進行數字編...

小波部分特徵說明和小波特徵比較 未寫完

小波特徵 1 多分辨分析可以對訊號進行有效的時頻分分解,但是由於其尺度函式是按二進位制變化的,因此在高頻段器頻率解析度較差,對訊號的頻段進行指數等間隔劃分。小波包能夠為訊號提供一種更加精細的分析方法,它將頻帶進行多層劃分,對多分辨分析沒有細分的高頻部分進一步分解,並能更具被分析訊號的特徵,自適應的選...

Android 音訊採集(原始音訊)

android 音訊簡介 常見的音訊編譯碼的型別 aac opus amr ogg pcm aac 高階音訊編碼 對應 m4a audio m4a 或者.3pg audio 3gpp 檔案 heaac 高階aac,使用的比較多。opus 有損聲音編碼的格式,由網際網路工程任務組 ietf 進來開發,...