音訊基礎 低頻失真 馬車輪效應

2021-06-19 17:25:13 字數 1982 閱讀 3238

把模擬音訊轉成數字音訊,在電腦**裡就稱作取樣,其過程所用到的主要硬體裝置便是模擬/數字轉換器(analog to digital converter,即adc)。取樣的過程實際上是將通常的模擬音訊訊號的電訊號轉換成許多稱作「位元(bit)」的二進位製碼0和1,這些0和1便構成了數字音訊檔案。如下圖,圖中的正弦曲線代表原始音訊曲線;填了顏色的方格代表取樣後得到的結果,二者越吻合說明取樣結果越好。

上圖中的橫座標便是取樣頻率;縱座標便是取樣解析度。圖中的格仔從左到右,逐漸加密,先是加大橫座標的密度,然後加大縱座標的密度。顯然,當橫座標的單位越小即兩個取樣時刻的間隔越小,則越有利於保持原始聲音的真實情況,換句話說,取樣的頻率越大則音質越***;同理,當縱座標的單位越小則越有利於音質的提高,即取樣的位數越大越好。有一點請大家注意,8位(8bit)不是說把縱座標分成8份,而是分成2^8=256份;同理16位是把縱座標分成2^16=65536份;而24位則分成2^24=16777216份。現在我們來進行乙個計算,看看乙個數字音訊檔案的資料量到底有多大。假設我們是用44.1khz、16bit來進行立體聲(即兩個聲道)取樣,即取樣成標準的cd音質(也稱作紅皮書音訊)。那麼就是說,一秒鐘內取樣44.1千次,每次的資料量是16×2=32bit(因為立體聲是兩個聲道)。而大家知道,乙個位元組(byte)含有8個位(bit),那麼一秒鐘內的資料量便是44.1k×32bit /(8bit / byte)=176.4 kbyte。乙個漢字在電腦裡占用兩個位元組,那麼176.4kb的空間可以儲存 176.4k / 2=88200個漢字,也就是說一秒鐘的數字音訊資料量與近九萬個漢字(一部中篇**)的資料量相當。由此可見,數字音訊檔案的資料量是十分龐大的。

也許有人會問,為什麼要把cd音質的取樣頻率規定成44.1khz而不是其他的頻率呢?這個問題問得好。44.1khz意味著每秒取樣四萬多下,這會不會太多了點呢?究竟每秒取樣多少次才算合理呢?大家請看下圖。圖中,上半部分表示原始音訊的波形;下半部分表示錄製後的波形;紅色的點表示取樣點。

大家可以發現,上下波形之所以不吻合,是因為取樣點不夠多,或嚴謹一點說,是取樣頻率不夠高。這種情況,我們稱之為低頻失真。

乙個常見的低頻失真的例子便是電影上車輛行駛時車輪轉動的情況(乙個典型的「馬車輪」效應的例子)。你也許早已發現,飛快轉動的車輪有時看起來似乎是靜止不動甚至會向反方向轉動(類似的情況也發生在直公升飛機的翼片和螺旋漿上面)。    關於合理的取樣頻率這一問題在nyquist(奈奎斯特)定理中早已有明確的答案:要想不產生低頻失真,則取樣頻率至少得是錄製的最高頻率的兩倍(上圖中,取樣頻率只是錄製頻率的4/3倍)。這個頻率通常稱作nyquist極限。

在正常的**中,最高的音符也只不過7khz-8khz,這似乎意味著16khz的取樣頻率便已足夠。其實這7、8khz僅僅表示基音的音高,還有大量的泛音未包括在內,故用這種方法來定取樣頻率是十分不科學的。其實,所謂「不失真」,換句話說便是「人們聽不到失真」。人類的聽力範圍是20hz-20khz,所以取樣頻率至少得是20k×2=40khz便可保證不產生低頻失真。cd音質的44.1khz正是這樣制定出來的(略高於40khz是為了留有餘地)。按照nyquist定理,這樣的取樣頻率可以保證即使是22.05khz的超聲波也不會產生低頻失真。而音訊的工業標準所規定的48khz取樣頻率(如dat,digital audio tape)則有更高的nyquist極限,滿足更苛刻的要求。

說到這裡,我們可以理解數字錄音的好處了。首先,錄製好的**是以數字來儲存的,而數字的傳輸錯誤率是相當低甚至是可以避免的,所以錄製好的**可以多次複製而效果不減(這在製作過程中十分重要)。而模擬訊號則每傳輸一次就失真一次。而且,模擬錄音的本底噪音很大,要想滿足嚴謹的錄音要求則需要購買複雜而又昂貴的裝置,操作也十分繁瑣。況且,處理數字資訊是電腦的拿手好戲,只需面對顯示器,所有的工作都可以彈指一揮間完成。正是基於以上這些優點,使得建立乙個家庭工作室(home studio)顯得非常具有吸引力,並且技術上也成為可能。

音訊程式設計基礎

取樣 量化 編碼 取樣就是每隔一定時間就讀一次聲音頻號的幅度,而量化則是將取樣得到的聲音頻號幅度轉換為數字值,從本質上講,取樣是時間上的數位化,而量化則是幅度上的數位化。音訊取樣 自然界中音訊訊號是一種連續變化的模擬訊號,但計算機只能處理和記錄二進位制的數碼訊號,由自然音源得到的音訊訊號必須經過模數...

音訊基礎,筆記

常見44.1khz,48khz的取樣率,也就是取樣頻率,物理意義就是一秒鐘對音訊取樣的次數。由於人耳分辨的頻率範圍是20hz 20khz,根據奈奎斯特取樣定理,需要40khz來保證不失真。取樣精度是指每一次取樣的資料精度,比如常見的16bits,或者粗糙一些的8bits。l 16bits r 16b...

音訊基礎學習(未完)

1.取樣頻率 sampling rate 取樣頻率是指每秒鐘抽取聲波幅度樣本的次數,其單位為hz 赫茲 取樣頻率不應低於原始聲音的最高頻率的2倍,這樣才能把以數字表達的聲音還原成原來的聲音。2.取樣精度 bit resolution 用於描述每個聲音樣本的振幅大小或者聲音樣本資料的二進位制位數。3....