語音頻號處理第二章
語音頻號處理第三章
語音頻號處理第四章
語音頻號處理第五章
語音頻號處理第七章
語音頻號處理第九章
語音頻號處理第十章
語音頻號處理第十二章
語音壓縮編碼
只針對考試內容,不全面講解各類編碼
語音合成系統模型:
評價標準:
分類:語音頻號編碼最簡單的方式是直接將語音頻號進行量化,只要量化位數足夠多,就能保證解碼後語音頻號有很好的音質。缺點是這樣所需的數碼率太高,傳輸通道難以承受。因此必須對語音頻號進行壓縮編碼
信源編碼主要解決有效性的問題,也就是資料壓縮的問題,以最少的數碼表述信源所發的訊號,減少容納給定資訊集合或資料取樣集合的訊號空間。通道編碼主要解決可靠性問題,即盡量使處理過的訊號在傳輸的過程中不出錯或少出錯,即使出了錯也要能自動檢錯和盡量糾錯。因此本章主要講信源編碼依據語音頻號的冗餘度和人的聽覺感知機理。
1)幅度非均勻分布。小幅度樣本出現的概率高。
2)對於短時自相關函式,相鄰樣本間的相關性很強。
3)濁音語音段具有準週期性。
4)聲道的形狀及其變化緩慢。
5)存在語音間隙。
1)非均勻的長時功率譜密度。高頻能量較低,對應於時域上相鄰樣本間的相關性。
2)對於短時功率譜密度,整個譜隨著頻率增加而遞減。整個譜形成基於基音頻率的高次諧波結構。共振峰頻率處能量較大。
1)掩蔽效應。高聲級單音會掩蔽臨近頻率聲音。可用於抑制與訊號同時存在的量化雜訊。
2)人耳對不同頻段聲音的敏感程度不同。人的聽覺對低頻段比較敏感,對高頻段不太敏感。
3)人耳對語音頻號的週期性(即音調)極為敏感,而對相位變化不敏感。
上限:語音壓縮編碼的極限速率(下限)為80~100bps
技術:
(1)線性**
短時相關性使用以下模型來描述:
長時相關性使用以下模型來描述:
一般來說,長時**係數的個數在1(q=r=0)到3(q=r=1)之間
(2)合成分析法:將綜合器引入編碼器,使之與分析器相結合,在編譯器中生成和解碼端完全一致的語音。將次合成語音與原始語音相比較,根據一定的誤差原則,來調整計算各個引數,使得兩者之間的誤差最小。
(3)感覺加權濾波器:
理想的編碼器應該是低速率、高語音質量、低時延、高誤碼容限、低複雜度、具有良好的健壯性和演算法可擴充套件性。
客觀評價的方法有訊雜比,主觀評價的方法有可懂度評價、音質評分
《語音頻號處理》第七章總結 向量量化
第7章 1 標量 向量量化的定義 理解 記憶 標量量化 是對取樣後的訊號逐個進行量化 向量量化 是將若干個取樣訊號分成一組,構成乙個向量,然後對此向量一次進行量化。二者的比較 率 失真理論 指出 向量量化總是優於標量量化,且向量維數越大效能越優越,因為向量量化有效地應用了向量中的各分量間的各種相互關...
語音頻號處理
濁音的聲帶振動基本頻率 fundamental frequency 稱為基音頻率。濁音的基音頻率 pitch 語音生成系統和語音感知系統 語音頻號生成的數學模型 語音頻號的特性分析 語音頻號處理是以語音語言學和數字訊號處理為基礎的綜合性學科,是用數字訊號處理技術對語音頻號進行處理的一門學科。說話人識...
python第七章 python教程(第七章)
字典和集合 字典是python中唯一,乙個對映型別 如何建立乙個字典,如下 dict dict 滲透 網路安全 怎麼理解字典呢?現實生活中的字典可以通過首字母進行查詢要查詢的漢子,python也可以這樣理解,通過 前的元素查詢到冒號後的元素。為什麼說字典是唯一乙個對映型別呢?看圖。對映型別區別與序列...