語音頻號處理 梅爾倒頻譜係數MFCC

2021-08-17 15:46:53 字數 460 閱讀 5038

一句話概括:將時域的語音變為頻域的,對頻域的訊號進行分段濾波,得出不同頻率段的佔比(比如分為26段),所得到的佔比係數組成的矩陣,就是梅爾倒頻譜係數mfcc

作用人之所以能夠通過人聲辨別說話人的身份,是因為每個人的聲道不同,而這個聲道就相當於收集聲音的器物。我們需要提出乙個資料表示方式來代表每個人特定的聲道,這樣,我們只需要知道某個人,這個特定的資料表示形式,就知道了這個語音講話者的身份。這個特定的資料表示方式,就是梅爾倒頻譜係數mfcc

mfcc的物理含義,簡單地說可以理解為語言訊號的能量在不同頻率範圍的分布係數佔比。

傅利葉變換;倒譜;

流程參考部落格

參考鏈結1

mfcc_ppt

**實現參考

語音頻號處理

濁音的聲帶振動基本頻率 fundamental frequency 稱為基音頻率。濁音的基音頻率 pitch 語音生成系統和語音感知系統 語音頻號生成的數學模型 語音頻號的特性分析 語音頻號處理是以語音語言學和數字訊號處理為基礎的綜合性學科,是用數字訊號處理技術對語音頻號進行處理的一門學科。說話人識...

語音頻號的預處理

2014年09月05日 綜合 共 1116字 字型大小 小 中 大 回顧上兩次的內容 上次主要說了音訊檔案的讀取 主要是matlab和c語言 感覺有幾個概念有點混淆 語音 音訊 語音英文是speech,音訊是audio,是music。據我的理解是音訊包括語音和 不知道這麼理解對不?此外,讀取音訊其實...

語音頻號處理共振峰

首先,什麼是語譜圖。最通常的,就是語音短時傅利葉變換的幅度畫出的2d圖。之所以是通常的,是因為可以不是傅利葉變換。窄帶 顧名思義,頻寬小,則時寬大,則短時窗長,窄帶語譜圖就是長窗條件下畫出的語譜圖。寬頻 正好相反。至於 橫豎條紋 窄帶語譜圖的帶寬窄,那麼在頻率上就 分得開 即能將語音各次諧波 看得很...