AMR音訊格式分析

2021-07-23 20:29:23 字數 3795 閱讀 4406

amr,全稱是:adaptive multi-rate,自適應多速率,是一種音訊編碼檔案格式,專用於有效地壓縮語音頻率。

amr音訊主要用於移動裝置的音訊壓縮,壓縮比非常高,但是音質比較差,主要用於語音類的音訊壓縮,不適合對音質要求較高的**類音訊的壓縮。

1.1

amr分類

1.

amr:

又稱為amr-nb,相對於下面的wb而言,

語音頻寬範圍:300-3400hz,

8khz抽樣

2.

amr-wb:

amr wideband,

語音頻寬範圍:50-7000hz

16khz抽樣

「amr-wb」全稱為「adaptive multi-rate - wideband」,即「自適應多速率寬頻編碼」,取樣頻率為16khz,是一種同時被國際標準化組織itu-t和3gpp採用的寬頻語音編碼標準,也稱 為g722.2標準。amr-wb提供語音頻寬範圍達到50~7000hz,使用者可主觀感受到話音比以前更加自然、舒適和易於分辨。

與之作比較,現在gsm用的efr(enhenced full rate,增強型全速率編碼)取樣頻率為8khz,語音頻寬為200~3400hz。

amr-wb應用於窄帶gsm(全速通道16k,gmsk)的優勢在於其可採用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當網路繁忙時c/i惡化,編碼器可以自動調整編碼模式,從而增強qos。在這種應用中,amr-wb抗擾 度優於amr-nb。

amr-wb應用於edge、3g可充分體現其優勢。足夠的傳輸頻寬保證amr-wb可採用從6.6kb/s到23.85kb/s共九種編碼,語音質量超越pstn固定**。

1.2

amr編碼方式

1.amr-nb編碼方式

amr 一共有16種編碼方式,0-7對應8種不同的編碼方式,8-15 用於噪音或者保留用:

frame type

mode indication

mode request

frame content (amr mode, comfort noise, or other)00

0amr 4,75 kbit/s 1

1 1

amr 5,15 kbit/s 2

2 2

amr 5,90 kbit/s 3

3 3

amr 6,70 kbit/s (pdc-efr) 4

4 4

amr 7,40 kbit/s (tdma-efr) 5

5 5

amr 7,95 kbit/s 6

6 6

amr 10,2 kbit/s 7

7 7

amr 12,2 kbit/s (gsm-efr) 8

- -

amr sid 9

- -

gsm-efr sid 10

- -

tdma-efr sid 11

- -

pdc-efr sid

12-14-

- for future use 15

- -

no data (no transmission/no reception)

2.amr-wb編碼方式

frame type index

mode indication

mode request

frame content (amr-wb mode, comfort noise, or other)00

0amr-wb 6.60 kbit/s 1

1 1

amr-wb 8.85 kbit/s 2

2 2

amr-wb 12.65 kbit/s 3

3 3

amr-wb 14.25 kbit/s 4

4 4

amr-wb 15.85 kbit/s 5

5 5

amr-wb 18.25 kbit/s 6

6 6

amr-wb 19.85 kbit/s 7

7 7

amr-wb 23.05 kbit/s 8

8 8

amr-wb 23.85 kbit/s 9

- -

amr-wb sid (comfort noise frame)

10-13-

- for future use 14

- -

speech lost 15

- -

no data (no transmission/no reception)

說明: l

位元率是指將數字聲音由模擬格式轉化成數字格式的取樣率,取樣率越高,還原後的音質就越好。

l位元率值與現實音訊對照:

16kbps=**音質

24kbps=增加**音質、短波廣播、長波廣播、歐洲制式中波廣播

40kbps=美國制式中波廣播

56kbps=話音

112kbps=fm調頻立體聲廣播

256kbps=studio**工作室(**發燒友適用)

l音訊資料幀大小的計算:

amr 一幀對應20ms,那麼一秒有50幀的音訊資料。由於位元率不同,每幀的資料大小也不同。

如果位元率是12.2kbs,那麼每秒取樣的音訊資料位數為:

12200 / 50 = 244bit = 30.5byte,取整為31位元組。

取整要四捨五入。

再加上乙個位元組的幀頭,這樣資料幀的大小為32位元組。

amr檔案格式如下所示:

header(檔案頭)

speech frame 1(語音幀1) …

speech fram n(語音幀n)

它包含乙個檔案頭,然後就是一幀一幀的amr資料了。

具體如下:

2.1 amr

檔案頭

amr 檔案支援單聲道和多聲道。單聲道和多聲道的檔案頭是不同的。單聲道(amr-nb)只包含乙個magic number;多聲道(amr-wb)包含magic number和乙個32位的chanel description field,多聲道情況下的32位通道描述字元,前28位都是保留字元,必須設定成0,最後4位說明使用的聲道個數。多聲道檔案頭長度比單聲道檔案頭長度大4個位元組。 1.

單聲道:

amr-nb檔案頭:"#!amr\n" (or 0x2321414d520a in hexadecimal)(引號內的部分)

amr-wb 檔案頭:"#!amr-wb\n" (or 0x2321414d522d57420a in hexadecimal).(引號內) 2.

多聲道:

多聲道的檔案頭包含乙個magic number和32bit channle description域。

magic number

chan-desc field

amr-nb 的magic number:"#!amr_mc1.0\n"

(or 0x2321414d525f4d43312e300a in hexadecimal).

amr-wb的magic number:"#!amr-wb_mc1.0\n"

(or 0x2321414d522d57425f4d43312e300a in hexadecimal).

32bit的channel description域的定義如下:

其中reserved bits必須為0,chan:表示當前檔案中含有幾個聲道。

AMR音訊檔案格式分析

amr音訊檔案格式分析 amr 一共有16種編碼方式.0 7對應8種不同的編碼方式,每種編碼方式的取樣頻率不同 8 15 用於噪音或者保留用.說明 音訊資料幀大小的計算 amr 一幀對應20ms,那麼一秒有50幀的音訊資料.由於位元率不同,每幀的資料大小也不同.如果位元率是12.2kbs.那麼每秒取...

AMR音訊檔案格式分析

amr音訊檔案格式分析 amr 一共同擁有16種編碼方式.0 7相應8種不同的編碼方式,每種編碼方式的取樣頻率不同 8 15 用於噪音或者保留用.說明 音訊資料幀大小的計算 amr 一幀相應20ms,那麼一秒有50幀的音訊資料.由於位元率不同,每幀的資料大小也不同.假設位元率是12.2kbs.那麼每...

mpeg 音訊格式科普

mpeg的音訊格式蠻多的,又是 又是aac,有些地方用mpga,mp4a表示mpeg的音訊,這之間到底有什麼區別和聯絡呢?最近花了兩天時間,通過網上的零散資料整理了一下。mpeg 1 part 3 也就是mpeg標準第1版的第3部分 定義了mpeg audio version 1,而其又包含3個la...