語音頻號處理第七章

2021-10-07 21:24:21 字數 1683 閱讀 6883

語音頻號處理第二章

語音頻號處理第三章

語音頻號處理第四章

語音頻號處理第五章

語音頻號處理第七章

語音頻號處理第九章

語音頻號處理第十章

語音頻號處理第十二章

語音壓縮編碼

只針對考試內容,不全面講解各類編碼

語音合成系統模型:

評價標準:

分類:語音頻號編碼最簡單的方式是直接將語音頻號進行量化,只要量化位數足夠多,就能保證解碼後語音頻號有很好的音質。缺點是這樣所需的數碼率太高,傳輸通道難以承受。因此必須對語音頻號進行壓縮編碼

信源編碼主要解決有效性的問題,也就是資料壓縮的問題,以最少的數碼表述信源所發的訊號,減少容納給定資訊集合或資料取樣集合的訊號空間。通道編碼主要解決可靠性問題,即盡量使處理過的訊號在傳輸的過程中不出錯或少出錯,即使出了錯也要能自動檢錯和盡量糾錯。因此本章主要講信源編碼

依據語音頻號的冗餘度和人的聽覺感知機理。

1)幅度非均勻分布。小幅度樣本出現的概率高。

2)對於短時自相關函式,相鄰樣本間的相關性很強。

3)濁音語音段具有準週期性。

4)聲道的形狀及其變化緩慢。

5)存在語音間隙。

1)非均勻的長時功率譜密度。高頻能量較低,對應於時域上相鄰樣本間的相關性。

2)對於短時功率譜密度,整個譜隨著頻率增加而遞減。整個譜形成基於基音頻率的高次諧波結構。共振峰頻率處能量較大。

1)掩蔽效應。高聲級單音會掩蔽臨近頻率聲音。可用於抑制與訊號同時存在的量化雜訊。

2)人耳對不同頻段聲音的敏感程度不同。人的聽覺對低頻段比較敏感,對高頻段不太敏感。

3)人耳對語音頻號的週期性(即音調)極為敏感,而對相位變化不敏感。

上限:語音壓縮編碼的極限速率(下限)為80~100bps

技術

(1)線性**

短時相關性使用以下模型來描述:

長時相關性使用以下模型來描述:

一般來說,長時**係數的個數在1(q=r=0)到3(q=r=1)之間

(2)合成分析法:將綜合器引入編碼器,使之與分析器相結合,在編譯器中生成和解碼端完全一致的語音。將次合成語音與原始語音相比較,根據一定的誤差原則,來調整計算各個引數,使得兩者之間的誤差最小。

(3)感覺加權濾波器

理想的編碼器應該是低速率、高語音質量、低時延、高誤碼容限、低複雜度、具有良好的健壯性和演算法可擴充套件性。

客觀評價的方法有訊雜比,主觀評價的方法有可懂度評價、音質評分

《語音頻號處理》第七章總結 向量量化

第7章 1 標量 向量量化的定義 理解 記憶 標量量化 是對取樣後的訊號逐個進行量化 向量量化 是將若干個取樣訊號分成一組,構成乙個向量,然後對此向量一次進行量化。二者的比較 率 失真理論 指出 向量量化總是優於標量量化,且向量維數越大效能越優越,因為向量量化有效地應用了向量中的各分量間的各種相互關...

語音頻號處理

濁音的聲帶振動基本頻率 fundamental frequency 稱為基音頻率。濁音的基音頻率 pitch 語音生成系統和語音感知系統 語音頻號生成的數學模型 語音頻號的特性分析 語音頻號處理是以語音語言學和數字訊號處理為基礎的綜合性學科,是用數字訊號處理技術對語音頻號進行處理的一門學科。說話人識...

python第七章 python教程(第七章)

字典和集合 字典是python中唯一,乙個對映型別 如何建立乙個字典,如下 dict dict 滲透 網路安全 怎麼理解字典呢?現實生活中的字典可以通過首字母進行查詢要查詢的漢子,python也可以這樣理解,通過 前的元素查詢到冒號後的元素。為什麼說字典是唯一乙個對映型別呢?看圖。對映型別區別與序列...