語音壓縮編碼研究的基本問題就是在一定的編碼速率下,如何用較低的複雜度和較小的時延獲得盡量好的重建語音,因此重建語音質量、編碼速率、演算法複雜度、演算法延遲是衡量編解碼器效能的四個主要因素。表2-1是上述voip常用語音編碼器的指標的對比[1]
,[4]
,[5]
,[6] 。
縱觀集中編解碼器,ilbc有很多技術優勢,主要表現在:
(1) 占用頻寬少
在20ms幀時,ilbc所佔總的頻寬為27.73kbit/s,而g.729a為29.6kbit/s,g.723.1為19.7kbit/s,gsm為34.8kbit/s。
(2) 語音質量高
在20ms幀時,ilbc的mos(平均主觀得分)為3.981,而g.729為3.92,g.723.1為3.9,gsm為3.782。
(3) 支援多幀
支援20ms和30ms幀,對於不同的應用或voip裝置更為靈活。
(4) 低時延和丟包處理特性
ilbc的主要優勢在於對丟包的處理能力。在正常情況下,ilbc會記錄下當前資料的相關引數和激勵訊號,以便在之後的資料丟失情況下進行處理;在當前資料接收正常而之前資料報丟失的情況下,ilbc會對當前解碼出的語音和之前模擬生成的語音進行平滑處理,以消除不連貫的感覺;在當前資料報丟失的情況下,ilbc會對之前記錄下來的激勵訊號進行相關處理並與隨機訊號進行混合,以得到模擬的激勵訊號,從而得到替代丟失語音的模擬語音。總的來說,和標準的低位速率編譯碼相比,ilbc使用更多自然,清晰的元素,能夠精確模仿出原始語音頻號。
在實際選擇語音壓縮標準時,要綜合考慮頻寬、時延、演算法複雜度等幾大因素。本課題中選擇的編解碼器為g.729a,它採用了共軛結構代數碼激勵線性**技術,是編碼速率和合成語音質量綜合效率最優的壓縮演算法之一,被廣泛的用在voip中,其在opnet中有現成的實現模組。
表2-1 voip語音編碼器的指標的對比
編碼演算法
編碼型別
位元率(kb/s)
mos複雜性(mipsontic54)
時延/ms
g.711
pcm4.1
1.05
0.75
g.723.1
acelp
6.33.9
43.7
mp-mlq
6.33.8
g.726
adpcm
40/32/24/16
3.85
10.8
g.728
ld-celp
3.61
3~5g.729
csa-celp
3.92
10.88(g.729ab)
ilbc(20ms)
引數編碼
27.73
3.981
35倍g.711
eg.711(10,20,30,40ms)
改進型pcm
<=g.711
=g.711
4.8=幀長
isac(30~60ms)
10~32
=g.722.2
76倍g.711
=幀長+3ms
ipcm-wb(10,20,30,40ms)
平均80
>g.722.1
8.6mips
=幀長
語音編解碼器 2
2.1.1.1 ilbc協議 6 2.1.1.2 eg.711 eg.711是gips公司基於標準g.711編碼 解碼器的改進型產品,具有極好的抗包丟失強健性。這種改進型編碼 解碼器,使嚴重超載的網路也能保持良好音質。2.1.1.3 ipcm wb ipcm wb是優質 低複雜度寬頻編碼 解碼器,對...
編解碼器的詳細介紹
業務是網路的主要業務之間。尤其移動網際網路業務的興起,在運營商和應用開發商中,業務份量極重,其中 的編譯碼服務涉及需求分析 應用開發 釋放license收費等等。最近因為專案的關係,需要理清 的codec,比較搞的是,在豆丁網上看運營商的規範 標準,同一運營商同樣的業務在不同文件中不同的要求,而且有...
解碼器基礎
初次接觸解碼器的童鞋可能會問,解碼器是什麼?首先,我們需要明確,電腦和人類溝通,需要轉換。因為人類對於抽象語言比較擅長,而當前的計算機本質上只能識別0 1二進位制串。因此,人類所表達的知識要被電腦接受,需要將其轉換編碼成二進位制數,這一過程可以理解為編碼 而人類要理解計算機給我們計算的結果,則需要將...