音訊開發基礎知識簡介

2021-08-20 12:28:20 字數 1118 閱讀 2993

下面簡單介紹音訊的基礎知識:

取樣位數:

數碼訊號是用0和1來表示的。取樣位數就是取樣值用多少位0和1來表示,也叫取樣精度,用的位數越多就越接近真實聲音。如用8位表示,取樣值取值範圍就是-128--127,如用16位表示,取樣值取值範圍就是-32768--32767。現在一般都用16位取樣位數。

聲道(channel)

通常語音只用乙個聲道。而對於**來說,既可以是單聲道(mono),也可以是雙聲道(即左聲道右聲道,叫立體聲stereo),還可以是多聲道,叫環繞立體聲,

多用於影院中。

編譯碼如果把取樣值直接儲存或者傳送,會占用很大的儲存空間或者很大的流量。以16khz取樣率16位取樣位數單聲道為例,一秒鐘就有32000(2位元組*16000)位元組。通常需要把取樣後的數碼訊號壓縮後才儲存或者傳送。把取樣值壓縮叫編碼(encode),形成位元流(bitstream). 把位元流還原出取樣值叫解碼(decode),統稱編譯碼(codec)。

音訊的編譯碼

通常也把音訊取樣過程叫脈衝編碼調製編碼,即pcm(pulse code modulation)編碼,取樣值也叫pcm值。為了節省儲存空間或者傳送流量,會對pcm值壓縮。目前

主要有三大技術標準組織制定壓縮標準:

a)itu,主要制定有線語音的壓縮標準(g系列),有g711/g722/g726/g729等。

b)3gpp,主要制定無線語音的壓縮標準(amr系列等), 有amr-nb/amr-wb。後來itu吸納了amr-wb,形成了g722.2。

c)mpeg,主要制定**的壓縮標準,有11172-3,13818-3/7,14496-3等。

一些大公司或者組織也制定壓縮標準,比如ilbc,opus。

無失真壓縮和有失真壓縮:把pcm資料壓縮後無任何損傷叫無失真壓縮,不過壓縮程度不高。把pcm資料壓縮後有損傷叫有失真壓縮,最多可以壓到幾十分之一,不過音訊質量差些。

音訊前後處理

音訊處理是指對pcm資料(也叫線性資料)進行處理,從而達到想要的效果,如回聲消除。

對音訊編碼前的pcm資料進行處理叫音訊前處理,主要用於語音中,來去除各種干擾,使聲音更清晰,主要有回聲消除、雜訊抑制、增益控制等。

對音訊解碼後的pcm資料進行處理叫音訊後處理,主要用於**中,來產生各種音效,使**更動聽,主要有均衡器、混響等。

音訊基礎知識

1.音效卡的工作原理 音效卡的工作原理其實很簡單 我們知道,麥克風和喇叭所用的都是模擬訊號,而電腦所能處理的都是數碼訊號,兩者不能混用,音效卡的作用就是實現兩者的轉換。從結構上分,音效卡可分為模數轉換電路和數模轉換電路兩部分,模數轉換電路負責將麥克風等聲音輸入裝置採到的模擬聲音頻號轉換為電腦能處理的...

音訊基礎知識

聲音的三要素 頻率,振幅,波形 頻率代表音階的高低 女生的音階高,男生偏低 頻率越高,波長就會越短.振幅代表響度 波形代表音色 音訊取樣 對模型訊號進行取樣,取樣可以理解為在時間軸上對訊號進行數位化 ad轉換 按比聲音最高頻率高2倍以上的頻率對聲音進行取樣.取樣率 聲音頻率為500次,取樣1000次...

視音訊基礎知識 I,P,B,PTS,DTS

在沒有b幀存在的情況下dts的順序和pts的順序應該是一樣的。兩個i frame之間形成乙個gop,在x264中同時可以通過引數來設定bf的大小,即 i 和p或者兩個p之間b的數量。不含b幀 對於不含b幀的影象序列,例如 影象序列 ippipp.顯示時候一般按正常順序顯示 ippipp.即 pts。...