會議電視常用音訊協議介紹及對比***
一、數位化音訊原理:聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。通常人耳可以聽到的頻率在20hz到20khz的聲波稱為為可聽聲,低於20hz的成為次聲,高於20khz的為超聲,多**技術中只研究可聽聲部分。
可聽聲中,話音訊號的頻段在80hz到3400hz之間,**訊號的頻段在20hz-20khz之間,語音(話音)和**是多**技術重點處理的物件。
由於模擬聲音在時間上是連續的,麥克風採集的聲音頻號還需要經過數位化處理後才能由計算機處理。通常我們採用pcm編碼(脈衝**調製編碼),即通過取樣、量化、編碼三個步驟將連續變化的模擬訊號轉換為數字編碼。
1、取樣
取樣,就是每隔一段時間間隔讀一次聲音的幅度。單位時間內取樣的次數稱為取樣頻率。顯然取樣頻率越高,所得到的離散幅值的資料點就越逼近於連續的模擬音訊訊號曲線,同時取樣的資料量也越大。
為了保證數位化的音訊能夠準確(可逆)地還原成模擬音訊進行輸出,取樣定理要求:取樣頻率必須大於等於模擬訊號頻譜中的最高頻率的2倍。
常用的音訊取樣率有:8khz、11.025khz、22.05khz、16khz、37.8khz、44.1khz、48khz。
例如:話音訊號頻率在0.3~3.4khz範圍內,用8khz的抽樣頻率(fs),就可獲得能取代原來連續話音訊號的抽樣訊號,而一般cd採集取樣頻率為44.1khz。
2、量化
量化,就是把取樣得到的聲音頻號幅度轉換成數字值,用於表示訊號強度。
量化精度:用多少個二進位來表示每乙個取樣值,也稱為量化位數。聲音頻號的量化位數一般是 4,6,8,12或16 bits 。
由取樣頻率和量化精度可以知道,相對自然界的訊號,音訊編碼最多只能做到無限接近,在計算機應用中,能夠達到最高保真水平的就是pcm編碼,通常pcm約定俗成了無損編碼。
3、編碼
乙個取樣率為44.1khz,量化精度為16bit,雙聲道的pcm編碼輸出,它的資料速率則為 44.1k×16×2 =1411.2 kbps,儲存一秒鐘需要176.4kb的空間,1分鐘則約為10.34m,因此,為了降低傳輸或儲存的費用,就必須對數字音訊訊號進行編碼壓縮。
到目前為止,音訊訊號經壓縮後的數碼率降低到32至256kbit/s,語音可以低至8kbit/s以下。
對數字音訊資訊的編碼進行壓縮的目的是在不影響人們使用的情況下使數字音訊資訊的資料量最少。通常用如下6個屬性來衡量:
—位元率;
—訊號的頻寬。
—主觀/客觀的語音質量;
—延遲;
—計算複雜度和對儲存器的要求;
—對於通道誤碼的靈敏度;
為使編碼後的音訊資訊可以被廣泛地使用,在進行音訊資訊編碼時需要採用標準的演算法。傳統會議電視裝置主要採用itu-t推薦的g.711、g.722、g.728和aac_ld等音訊標準。
二、常用音訊協議簡介:1、
itu-t g.728
7、 各種音訊協議的主要引數對比:
取樣頻率
支援音訊頻寬
輸出位元速率
最低演算法延遲
g711
8khz
300 hz ~ 3,400 hz
64 kbps
<1ms
g722
16khz
50 hz ~ 7 khz
64 kbps
3ms
g722.1
16khz
50 hz ~7 khz
24、32 kbps
40ms
g722.1 c
32khz
50 hz~14 khz
24、32、48kbps
40ms
aac-ld
48khz
20 hz-20khz
48~64 kbps
20ms
三、aac_ld與g722. annex c優缺點對比:
g722.1 c
aac_ld
取樣音訊頻率範圍支援50 hz~14 khz,接近cd音質,但丟失了高頻部分。
支援20 hz-20khz全頻段的取樣,音訊更加接近cd音質。
輸出位元速率24、32、48kbps,頻寬低於aac-ld,但是以犧牲高頻為代價的。
48~64 kbps,並支援大於64kbps的輸出,為更好的音訊質量提供了可能。
演算法複雜性演算法複雜度低,cpu佔用率略好於aac-ld
模組化設計,功能更為強大,有ti等專用晶元支援
最低延遲採用20ms封幀,40ms演算法延遲
20ms演算法延遲,好於g722.1 c
多聲道可以支援雙聲道
aac支援多達48個音軌、15個低頻音軌
常用音訊協議介紹
會議電視常用音訊協議介紹及對比 一 數位化音訊原理 聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。通常人耳可以聽到的頻率在20hz到20khz的聲波稱為為可聽聲,低於20hz的成為次聲,高於20khz的為超聲,多 技術中只研究可聽聲部分。可聽聲中,話音訊號的...
常用音訊協議介紹
會議電視常用音訊協議介紹及對比 一 數位化音訊原理 聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。通常人耳可以聽到的頻率在20hz到20khz的聲波稱為為可聽聲,低於20hz的成為次聲,高於20khz的為超聲,多 技術中只研究可聽聲部分。可聽聲中,話音訊號的...
音訊編碼協議介紹
針對音訊壓縮不同標準組織和公司有很多不同技術和標準可用,在下列 中,主要的被列舉如下 編解碼器型別標準組織調製方法位率 kb s 取樣率 khz g.711 itu t pcm64 8g.721 itu t adpcm328 g.722 itu t adpcm 6416 g.722.1 itu t ...