H 264的技術優勢及其在H 323系統中的應用

一、引言

（2）抗丟包效能和抗誤碼效能好，適應各種網路環境，包括丟包和誤碼嚴重的無線網路。

二、h.264適於h.323系統的三個技術優勢

1. 壓縮率和影象質量方面

對傳統的幀內**、幀間**、變換編碼和熵編碼等演算法的改進，使h.264的編碼效率和影象質量在以往標準的基礎上進一步提高。

（1）可變塊大小：幀間**時可以靈活選擇塊的大小。在巨集塊（mb）劃分上h.264採用了16×16，16×8，8×16，8×8四種模式；當劃分為8×8模式時，又可進一步採用8×4、4×8、4×4三種子巨集塊劃分模式進一步劃分，這樣可以使運動物體的劃分更加精確，減小**誤差，提高編碼效率。幀內**一般採取兩種亮度**模式：intra_4×4和intra_16×16。intra_4×4適合影象中細節豐富的區域，而intra_16×16模式更適合粗糙的影象區域。

（2）高精度運動估值：在h.264中亮度訊號運動補償**的精度是1/4畫素。如果運動向量指向參考影象的整畫素位置，**值就是該位置上參考影象畫素的值；否則使用6階fir濾波器的線性內插獲得1/2畫素位置的**值，通過取整數和1/2畫素位置畫素值均值的方式獲得1/4畫素位置的值。顯然採用高精度運動估計會進一步減小幀間**誤差。

（3）多參考幀運動估值：每乙個m×n亮度塊都要經過運動補償**得到運動向量和參考影象索引，子巨集塊中的每個子巨集塊劃分都會有不同的運動向量。選擇參考影象過程是在子巨集塊層次上進行的，因而乙個子巨集塊中的多個子巨集塊劃分在**時使用相同的參考影象，而同乙個slice的多個子巨集塊之間選擇的參考影象可以不同，這就是多參考幀運動估值。

（4）參考影象的選取更加靈活：參考影象甚至可以是採用雙向**編碼方式的影象，這就允許選取與當前影象更加匹配的影象為參考影象進行**，從而可以減小**誤差。

（5）加權**：允許編碼器以一定的係數對運動補償**值進行加權，從而在一定的場景下可以提高影象質量。

（6）運動補償迴圈內的消除塊效應濾波器：為消除在**和變換過程中引入的塊效應，h.264也採用了消除塊效應濾波器，但不同的是h.264的消除塊效應濾波器位於運動估計迴圈內部，因而可以利用消除塊效應以後的影象去**其他影象的運動，從而進一步提高**精度。

2. 抗丟包和抗誤碼方面

引數集、片的使用、fmo、冗餘片等關鍵技術的使用可以大大提高系統的抗丟包和抗誤碼效能。

（1）引數集：引數集及其靈活的傳送方式會大大降低因關鍵的頭資訊丟失而造成錯誤發生的可能。為保證引數集可靠地到達解碼器端，可以採用重發的方式多次傳送同一引數集，或傳送多個引數集。

（2）片（slice）的使用：影象可以劃分成乙個或幾個片。將影象劃分為多個片，當某一片不能正常解碼時的空間視覺影響就會大大降低，而且片還提供了重同步點。

（3）paff和mbaff：當對隔行掃瞄影象進行編碼時，由於兩個場之間存在較大的掃瞄間隔，這樣，對運**像來說幀中相鄰兩行的空間相關性相對於逐行掃瞄時就會減小，這時對兩個場分別進行編碼會更節省碼流。對幀來說，存在三種可選的編碼方式，將兩場合併作為一幀進行編碼或將兩場分別編碼或將兩場合併起來作為一幀，但不同的是將幀中垂直相鄰的兩個巨集塊合併為巨集塊對進行編碼。前兩種稱為paff編碼，對運動區域進行編碼時場方式有效，非運動區域由於相鄰兩行有較大的相關性，因而幀方式會更有效。當影象同時存在運動區域和非運動區域時，在mb層次上，對運動區域採取場方式，對非運動區域採取幀方式會更加有效，這種方式就稱為mbaff。

（4）fmo：通過fmo可以進一步提高片的差錯恢復能力。通過片組（slice group）的使用，fmo改變了影象劃分為片和巨集塊的方式。巨集塊到片組的對映定義了巨集塊屬於哪乙個片組。利用fmo技術，h.264定義了七種巨集塊掃瞄模式。

（2）冗餘影象：為提高h.264的解碼器在發生資料丟失時的頑健性，可以採用傳送冗餘影象的方式。當基本影象丟失時，可以通過冗餘影象重構原影象。

（3）資料劃分：由於運動向量和巨集塊型別等資訊相對於其他資訊具有更高的重要性，因而在h.264中引入了資料劃分的概念，將片中語義彼此相關的語法元素放在同乙個劃分中。在h.264中有三類不同的資料劃分，三類資料劃分分開傳送，若第二類或第三類劃分的資訊丟失，使用差錯恢復工具仍然可以通過第一類劃分中的資訊對丟失資訊進行適當恢復。

（4）多參考幀運動估值：多參考幀運動估值不但可以提高編碼器的編碼效率，還可以提高差錯恢復能力。在h.323系統中，通過使用rtcp，當編碼器得知有參考影象丟失時，可以選擇解碼器已經正確接收的影象作為參考影象。

（5）為阻止錯誤在空間上的蔓延，解碼器端可以指定當p片或b片中的巨集塊在做幀內**時不使用相鄰的非幀內編碼巨集塊作為參考。

3. 網路適應性方面

三、在h.323系統中實現h.264

首先，要規定如何在h.245能力協商過程中定義h.264能力。h.264能力集是乙個包含乙個或多個h.264能力的列表，每乙個h.264能力都包含profile和level兩個必選引數和custommaxmbps、custommaxfs等幾個可選引數。在h.264中，profile用於定義生成位元流的編碼工具和演算法，level則是對一些關鍵的引數要求。h.264能力包含在genericcapability結構中，其中capabilityidentifier的型別為standard，值為0.0.8.241.0.0.1，用於標識h.264能力。maxbitrate用於定義最大位元率。collapsing欄位包含h.264能力引數。collapsing欄位第乙個條目是profile，parameteridentifier型別為standard，值為41，用於標識profile，parametervalue型別為booleanarray，其值標識profile，可以為64、32或16，這三個值依次表示baseline、main和extended三個profile；collapsing欄位第二個條目是level，parameteridentifier型別為standard，值為42，用於標識level，parametervalue型別為unsignedmin，其值標識h.264 annexa中定義的15個可選的level值。其他的幾個引數作為可選項出現。

其次，由於h.264中影象的組織結構與傳統的標準不同，一些原有的h.245信令不在適用於h.264，如miscellaneouscommand中的videofastupdategob等，因此h.241重新定義了幾個信令提供相應功能。

最後，h.264的rtp封裝參考rfc 3550，載荷型別（pt）域未作規定。

四、結束語

作為一種新的國際標準，h.264在編碼效率、影象質量、網路適應性和抗誤碼方

H 264的技術優勢及其在H 323系統中的應用

H 264在IPTV系統中的應用

H 264 中的 NAL 技術簡單的介紹

在BF561上實現h264編碼的幾種方案

H 264的技術優勢及其在H 323系統中的應用

H 264在IPTV系統中的應用

H 264 中的 NAL 技術簡單的介紹

在BF561上實現h264編碼的幾種方案

相關推薦