語音編解碼器 3

2021-09-30 04:30:06 字數 1629 閱讀 6835

語音壓縮編碼研究的基本問題就是在一定的編碼速率下,如何用較低的複雜度和較小的時延獲得盡量好的重建語音,因此重建語音質量、編碼速率、演算法複雜度、演算法延遲是衡量編解碼器效能的四個主要因素。表2-1是上述voip常用語音編碼器的指標的對比[1]

,[4]

,[5]

,[6] 。

縱觀集中編解碼器,ilbc有很多技術優勢,主要表現在:

(1)   占用頻寬少

在20ms幀時,ilbc所佔總的頻寬為27.73kbit/s,而g.729a為29.6kbit/s,g.723.1為19.7kbit/s,gsm為34.8kbit/s。

(2)   語音質量高

在20ms幀時,ilbc的mos(平均主觀得分)為3.981,而g.729為3.92,g.723.1為3.9,gsm為3.782。

(3)   支援多幀

支援20ms和30ms幀,對於不同的應用或voip裝置更為靈活。

(4)       低時延和丟包處理特性

ilbc的主要優勢在於對丟包的處理能力。在正常情況下,ilbc會記錄下當前資料的相關引數和激勵訊號,以便在之後的資料丟失情況下進行處理;在當前資料接收正常而之前資料報丟失的情況下,ilbc會對當前解碼出的語音和之前模擬生成的語音進行平滑處理,以消除不連貫的感覺;在當前資料報丟失的情況下,ilbc會對之前記錄下來的激勵訊號進行相關處理並與隨機訊號進行混合,以得到模擬的激勵訊號,從而得到替代丟失語音的模擬語音。總的來說,和標準的低位速率編譯碼相比,ilbc使用更多自然,清晰的元素,能夠精確模仿出原始語音頻號。

在實際選擇語音壓縮標準時,要綜合考慮頻寬、時延、演算法複雜度等幾大因素。本課題中選擇的編解碼器為g.729a,它採用了共軛結構代數碼激勵線性**技術,是編碼速率和合成語音質量綜合效率最優的壓縮演算法之一,被廣泛的用在voip中,其在opnet中有現成的實現模組。

表2-1 voip語音編碼器的指標的對比

編碼演算法

編碼型別

位元率(kb/s)

mos複雜性(mipsontic54)

時延/ms

g.711

pcm4.1

1.05

0.75

g.723.1

acelp

6.33.9

43.7

mp-mlq

6.33.8

g.726

adpcm

40/32/24/16

3.85

10.8

g.728

ld-celp

3.61

3~5g.729

csa-celp

3.92

10.88(g.729ab)

ilbc(20ms)

引數編碼

27.73

3.981

35倍g.711

eg.711(10,20,30,40ms)

改進型pcm

<=g.711

=g.711

4.8=幀長

isac(30~60ms)

10~32

=g.722.2

76倍g.711

=幀長+3ms

ipcm-wb(10,20,30,40ms)

平均80

>g.722.1

8.6mips

=幀長

語音編解碼器 2

2.1.1.1 ilbc協議 6 2.1.1.2 eg.711 eg.711是gips公司基於標準g.711編碼 解碼器的改進型產品,具有極好的抗包丟失強健性。這種改進型編碼 解碼器,使嚴重超載的網路也能保持良好音質。2.1.1.3 ipcm wb ipcm wb是優質 低複雜度寬頻編碼 解碼器,對...

編解碼器的詳細介紹

業務是網路的主要業務之間。尤其移動網際網路業務的興起,在運營商和應用開發商中,業務份量極重,其中 的編譯碼服務涉及需求分析 應用開發 釋放license收費等等。最近因為專案的關係,需要理清 的codec,比較搞的是,在豆丁網上看運營商的規範 標準,同一運營商同樣的業務在不同文件中不同的要求,而且有...

解碼器基礎

初次接觸解碼器的童鞋可能會問,解碼器是什麼?首先,我們需要明確,電腦和人類溝通,需要轉換。因為人類對於抽象語言比較擅長,而當前的計算機本質上只能識別0 1二進位制串。因此,人類所表達的知識要被電腦接受,需要將其轉換編碼成二進位制數,這一過程可以理解為編碼 而人類要理解計算機給我們計算的結果,則需要將...