音訊開發基礎知識簡介

下面簡單介紹音訊的基礎知識：

取樣位數：

數碼訊號是用0和1來表示的。取樣位數就是取樣值用多少位0和1來表示，也叫取樣精度，用的位數越多就越接近真實聲音。如用8位表示，取樣值取值範圍就是-128--127，如用16位表示，取樣值取值範圍就是-32768--32767。現在一般都用16位取樣位數。

聲道（channel）

通常語音只用乙個聲道。而對於**來說，既可以是單聲道（mono），也可以是雙聲道（即左聲道右聲道，叫立體聲stereo），還可以是多聲道，叫環繞立體聲，

多用於影院中。

編譯碼如果把取樣值直接儲存或者傳送，會占用很大的儲存空間或者很大的流量。以16khz取樣率16位取樣位數單聲道為例，一秒鐘就有32000（2位元組*16000）位元組。通常需要把取樣後的數碼訊號壓縮後才儲存或者傳送。把取樣值壓縮叫編碼（encode），形成位元流（bitstream）. 把位元流還原出取樣值叫解碼（decode），統稱編譯碼（codec）。

音訊的編譯碼

通常也把音訊取樣過程叫脈衝編碼調製編碼，即pcm（pulse code modulation）編碼，取樣值也叫pcm值。為了節省儲存空間或者傳送流量，會對pcm值壓縮。目前

主要有三大技術標準組織制定壓縮標準：

a）itu，主要制定有線語音的壓縮標準（g系列），有g711/g722/g726/g729等。

b）3gpp,主要制定無線語音的壓縮標準（amr系列等）, 有amr-nb/amr-wb。後來itu吸納了amr-wb，形成了g722.2。

c）mpeg,主要制定**的壓縮標準，有11172-3，13818-3/7，14496-3等。

一些大公司或者組織也制定壓縮標準，比如ilbc，opus。

無失真壓縮和有失真壓縮：把pcm資料壓縮後無任何損傷叫無失真壓縮，不過壓縮程度不高。把pcm資料壓縮後有損傷叫有失真壓縮，最多可以壓到幾十分之一，不過音訊質量差些。

音訊前後處理

音訊處理是指對pcm資料（也叫線性資料）進行處理，從而達到想要的效果，如回聲消除。

對音訊編碼前的pcm資料進行處理叫音訊前處理，主要用於語音中，來去除各種干擾，使聲音更清晰，主要有回聲消除、雜訊抑制、增益控制等。

對音訊解碼後的pcm資料進行處理叫音訊後處理，主要用於**中，來產生各種音效，使**更動聽，主要有均衡器、混響等。

音訊開發基礎知識簡介

音訊基礎知識

音訊基礎知識

視音訊基礎知識 I,P,B,PTS,DTS

音訊開發基礎知識簡介

音訊基礎知識

音訊基礎知識

視音訊基礎知識 I,P,B,PTS,DTS

相關推薦