語音編碼標準

2021-04-20 07:41:52 字數 1156 閱讀 7221

1. 波形編碼

波形編碼是最簡單也是應用最早的語音編碼方法。最基本的一種就是pcm編碼,如g.711 建議中的a 律或μ 律。apcm、dpcm和adpcm也屬於波形編碼的範疇,使用這些技術的標準有g.721、g.726、g.727 等。波形編碼具有實施簡單、效能優良的特點,不足是編碼頻寬往往很難再進一步下降。

2. **編碼

語音頻號是非平穩訊號,但在短時間段內(一般是30ms)具有平穩訊號的特點,因而對語音頻號幅度進行**編碼是一種很自然的做法。最簡單的**是相鄰兩個樣點間求差分,編碼差分訊號,如g.721。但更廣為應用的是語音頻號的線性**編碼(lpc)。幾乎所有的基於語音頻號產生的全極點模型的引數編碼器都要用到lpc, 如g.728、g.729、g.723.1 建議。

3. 引數編碼

引數編碼是建立在人類語音產生的全極點模型的理論上,引數編碼器傳輸的編碼引數也就是全極點模型的引數- 基頻、線譜對、增益。對語音來說,引數編碼器的編碼效率最高,但對音訊訊號,引數編碼器就不太合適。典型的引數編碼器有lpc- 10、lpc-10e,當然,g.729、g.723.1 以及celp(fs- 1016)等碼

本激勵聲碼器都離不開引數編碼。

4. 變換編碼

一般認為變換編碼在語音頻號中作用不是很大,但在音訊訊號中它卻是主要的壓縮方法。比如,mpeg 伴音壓縮演算法(含著名的***) 用到fft、mdct 變換,ac- 3 杜比立體聲也用到mdct,g.722.1建議中採用的mlt 變換。在近年來出現的低速率語音編碼演算法中,stc(正弦變換編碼)和wi(波形插值)占有重要的位置,小波變換和gabor 變換在其中有用武之地。

5. 子帶編碼

子帶編碼一般是同波形編碼結合使用,如g.722 使用的是sb- adpcm技術。但子帶的劃分更多是對頻域係數的劃分(這可以更好地利用低頻帶比高頻帶感覺重要的特點),故子帶編碼中,往往先要應用某種變換方法得到頻域係數,在g.722.1 中使用mlt 變換,係數劃分為16 個子帶;mpeg 伴音中用fft 或mdct 變換,劃分的子帶多達32 個。

6. 統計編碼

統計編碼在影象編碼中大量應用,但在語音編碼中出於對編碼器整體效能的考慮(變長編碼易引起誤碼擴散),很少使用。對存在統計冗餘的訊號來說,統計編碼確實可以大大提高編碼的效率,所以,近年來出現的音訊編碼演算法中,統計編碼又重新得到了重視。mpeg 伴音和g.722.1 建議中採納了哈夫曼變長編碼。

語音編碼標準

1.波形編碼 波形編碼是最簡單也是應用最早的語音編碼方法。最基本的一種就是pcm編碼,如g.711 建議中的a 律或 律。apcm dpcm和adpcm也屬於波形編碼的範疇,使用這些技術的標準有g.721 g.726 g.727 等。波形編碼具有實施簡單 效能優良的特點,不足是編碼頻寬往往很難再進一...

各種語音編碼總結

g.726有四種位元速率 32,24,16 kbit s adaptive differential pulse code modulation adpcm 最為常用的方式是 32 kbit s,但由於其只是 g.711速率的一半,所以可將網路的可利用空間增加了一倍。g.726具體規定了乙個 64 ...

語音編碼 初步了解

語音編碼分為三大類 1.波形編碼 像pcm adpcm屬於波形編碼,該編碼方式針對波形的每個樣本點進行直接量化,或者利用波形之間的相關性進行壓縮,去掉冗餘,能夠保持比較好的語音質量,但是編碼速率要求高,壓縮小。2.參量編碼 像lpc編碼,formant編碼,vocoder編碼等屬於參量編碼。該編碼方...