語音編碼標準

1. 波形編碼

波形編碼是最簡單也是應用最早的語音編碼方法。最基本的一種就是pcm編碼，如g.711 建議中的a 律或μ 律。apcm、dpcm和adpcm也屬於波形編碼的範疇，使用這些技術的標準有g.721、g.726、g.727 等。波形編碼具有實施簡單、效能優良的特點，不足是編碼頻寬往往很難再進一步下降。

2. **編碼

語音頻號是非平穩訊號，但在短時間段內（一般是30ms）具有平穩訊號的特點，因而對語音頻號幅度進行**編碼是一種很自然的做法。最簡單的**是相鄰兩個樣點間求差分，編碼差分訊號，如g.721。但更廣為應用的是語音頻號的線性**編碼（lpc）。幾乎所有的基於語音頻號產生的全極點模型的引數編碼器都要用到lpc，如g.728、g.729、g.723.1 建議。

3. 引數編碼

引數編碼是建立在人類語音產生的全極點模型的理論上，引數編碼器傳輸的編碼引數也就是全極點模型的引數- 基頻、線譜對、增益。對語音來說，引數編碼器的編碼效率最高，但對音訊訊號，引數編碼器就不太合適。典型的引數編碼器有lpc- 10、lpc-10e，當然，g.729、g.723.1 以及celp（fs- 1016）等碼

本激勵聲碼器都離不開引數編碼。

4. 變換編碼

一般認為變換編碼在語音頻號中作用不是很大，但在音訊訊號中它卻是主要的壓縮方法。比如，mpeg 伴音壓縮演算法（含著名的***）用到fft、mdct 變換，ac- 3 杜比立體聲也用到mdct，g.722.1建議中採用的mlt 變換。在近年來出現的低速率語音編碼演算法中，stc（正弦變換編碼）和wi（波形插值）占有重要的位置，小波變換和gabor 變換在其中有用武之地。

5. 子帶編碼

子帶編碼一般是同波形編碼結合使用，如g.722 使用的是sb- adpcm技術。但子帶的劃分更多是對頻域係數的劃分（這可以更好地利用低頻帶比高頻帶感覺重要的特點），故子帶編碼中，往往先要應用某種變換方法得到頻域係數，在g.722.1 中使用mlt 變換，係數劃分為16 個子帶；mpeg 伴音中用fft 或mdct 變換，劃分的子帶多達32 個。

6. 統計編碼

統計編碼在影象編碼中大量應用，但在語音編碼中出於對編碼器整體效能的考慮（變長編碼易引起誤碼擴散），很少使用。對存在統計冗餘的訊號來說，統計編碼確實可以大大提高編碼的效率，所以，近年來出現的音訊編碼演算法中，統計編碼又重新得到了重視。mpeg 伴音和g.722.1 建議中採納了哈夫曼變長編碼。

語音編碼標準

語音編碼標準

各種語音編碼總結

語音編碼初步了解

語音編碼標準

語音編碼標準

各種語音編碼總結

語音編碼 初步了解

相關推薦

語音編碼初步了解