取樣對訊號頻率成分的影響

2021-07-13 04:31:35 字數 3006 閱讀 7160

數字計算機的普及促進了語音學的研究, 使人們能夠快速, 大量, 低成本地記錄, 儲存, 交換和分析聲音頻號. 然而, 由於數字計算機的核心是用離散的數字量來表達和記錄所有資訊的, 它從本質上不能被用來描述人類已有的全部數學概念和方法, 當然也就不能完全精確地表達所有的物理概念和物理測度. 單就聲音頻號來說, 物理上我們所希望測量的可能是聲壓隨時間的變化, 它在數學上對應著某個關於時間的連續函式. 數字計算機不能直接表達這種連續訊號, 而只能表達離散的時間序列(即離散訊號). 它甚至不能表達所有的離散訊號, 而只能表達在取值上也是離散的離散訊號(即數碼訊號). 所以我們用計算機來處理任何一種物理訊號時所面臨的首要問題就是連續訊號的數位化問題(或稱」模/數轉換」問題). 一般人們把連續訊號到離散訊號的過程叫取樣, 把測量值本身的離散化過程叫量化. 這裡我想講清楚的是取樣問題.

使用計算機前我們必須明確取樣過程對原始的連續訊號所造成的影響, 然後才能有信心地做後續的各種處理和分析工作. 著名的取樣定理(nyquist-shannon sampling theorem)就是幫助我們建立這種信心的乙個重要的指導性定理. 但是很遺憾, 人們容易對它有一些經常性的誤解. 現在我試試能不能盡量少用數學語言地把它說清楚.

定理涉及了幾個概念, 包括」取樣」,「取樣頻率」,「頻寬」和」完全重構」. 首先, 「取樣」在這裡指的是理想取樣, 即直接記錄訊號在某時間點的精確取值. 所以說, 取樣定理只涉及到了從連續訊號到離散訊號的理想取樣過程, 而未涉及到對測量值的量化過程. 其次, 「取樣頻率」指單位時間內的取樣點數, 它還暗示了這裡討論的取樣是一種週期性的操作, 非週期性取樣不在它討論的範圍之內. 第三,「頻寬」是乙個訊號的一種頻域引數. 這裡不得不提到」傅利葉分析」這種數學方法. 極簡略地說, 滿足某種數學條件的乙個隨時間變化的訊號(現實中的物理訊號大多滿足該條件), 或稱時域訊號, 可以被變換成乙個隨頻率變化的訊號(或稱頻域訊號), 這對時域訊號和頻域訊號之間的關係是通過由傅利葉提出的變換和反變換計算方法確定的. 時域訊號和頻域訊號其實是對同一物理測度從不同角度各自完備的表述. 當通常的時域訊號被變換到頻域內時, 它取值不為零的部分所跨越的頻率範圍就是這個訊號的頻寬. 定理中關於頻寬的表述有時會被誤用成」訊號最高頻率的兩倍」, 因為對於具有低通性質的訊號來說, 其通帶最高截止頻率和頻寬是一至的. 還好, 這個誤解對語音處理的影響不是很大. 第四, 所謂」完全重構」指的是給定了前面條件下得到的精確取樣值, 數學上可以精確地計算出原來連續訊號中任何乙個時間點的訊號值. 其實, 從定理的數學證明中可以順帶推出用來」完全重構」原始訊號的數學公式(即nyquist-shannon差值公式). 值得注意的是, 這個公式在數字計算機上是不可能精確實現的, 至少因為其中所使用的一族函式在時域內是無限長的.

取樣定理從2023年被nyquist提出到2023年被shannon正式地證明, 這中間跟計算機沒有什麼直接關係. 但是因為數字計算機只能處理離散的數碼訊號, 連續訊號必須經過取樣和量化才能被計算機處理, 所以取樣定理對計算機化的訊號處理技術具有基礎性的指導意義.

現在我們來著重討論取樣定理中」兩倍」的含義, 因為我覺得人們最容易從它的字面上引申而產生誤解. 一種普遍的誤解是這樣表述的: 「如果用取樣頻率fs對乙個訊號取樣, 訊號中fs/2以上的資訊會消失」. 這種誤解不僅是錯誤的, 而且是危險的. 取樣定理的證明過程顯示, 當用取樣頻率fs對乙個訊號取樣時, 訊號中fs/2以上的頻率成分不是消失了, 而是對稱地映象到了fs/2以下的頻帶中, 並且和fs/2以下的原有頻率成分迭加起來. 這個現象叫做」混疊」(aliasing), 是任何乙個連續訊號被離散化的必然結果(數學上通過傅利葉分析可以證明). 我們可以用下面圖示的例子來說明這個現象.

圖遺失(不影響閱讀)

上半圖中的藍色訊號是 x(t)=cos(2*pi*t) 的一部分, 它在頻域內只在 f=1hz 處有一條譜線. 當我們用 fs=4hz 對它取樣時, 可以得到的取樣點如上半圖中的紅圈所示. 因為我們的訊號和取樣頻率滿足取樣定理的條件, 所有我們可以從這些點重構訊號x(t). 下半圖中的藍色訊號是 y(t)=cos(2*pi*t)+cos(6*pi*t) 的一部分, 它在頻域內有 f=1, 3hz 兩條譜線. 當我們還用 fs=4hz 對它取樣時, 可以得到的取樣點如下半圖中的紅圈所示. 注意, 下半圖中取樣點的取值剛好分別是上半圖中對應取樣點取值的2倍. 如果用下半圖中的取樣點來重構訊號, 得到的將是 2*cos(2*pi*t) , 如綠色點劃線所示, 而非原訊號y(t). 看上去原來 f=3hz 的頻率成分好象是消失了, 其實這個頻率成分沿著 fs/2=2hz 對稱地映象到了 f=1hz 後與原有的頻率成分迭加到了一起. 這種對於低於fs/2頻率成分的破壞是無法恢復的. 所以說, 取樣定理的乙個重要指導意義是給出了防混疊的最低條件. 混疊本身是取樣的必然效應, 只不過如果混疊到原訊號頻寬範圍內的頻率成分為零的話, 訊號不會被破壞, 也就能」完全重構」了.

前面提到的誤解可能導致的危險後果是對所要觀測的頻帶範圍內引入混疊畸變. 計算機的電子器件(如顯示器)中有很多高頻噪音頻號, 它們不會因為高於fs/2而消失, 反而會因取樣而混入低頻帶. 語音頻號本身雖然整體上是低通特性(約-6db每倍頻程), 但它的高頻段不會是絕對的零. 這就是為什麼在現實的取樣技術中一定要有反混疊濾波步驟的原因. 這裡的邏輯關係是: 取樣必然導致混疊 –> 滿足取樣定理條件下的混疊不會破壞訊號(可重構) –> 反混疊濾波是把被研究訊號預先處理成滿足取樣定理條件的訊號. 當然現實中的反混疊濾波器也不可能是理想的. 濾波器越接近理想, 造價也就越高. 音響處理中有一種技術叫」過取樣」(oversampling), 其實是用效能一般(較便宜)的濾波器對訊號濾波後再用遠遠大於兩倍通頻帶的取樣頻率來取樣, 使造成混疊的頻率成分遠高於濾波器的截止頻率, 因為那裡的帶阻效能相對會更好些. 這些扯到技術細節了, 不多說. 不過我們應該看到, 一般計算機音效卡都不標出反混疊濾波器的指標, 因為音效卡的設計往往側重於放音; 而象csl這種專業錄音裝置會給出詳細的指標. 顯然, 它們的**差別不是沒有道理的.

關於取樣定理和濾波就討論這麼多. 再講乙個有趣的現象, 可以用取樣定理來解釋. 當我們看電影時, 如果裡面有螺旋槳飛機啟動的鏡頭, 我們會看到螺旋槳片先是越轉越快, 然後在某時會突然看起來變慢了, 甚至反轉. 這是因為電影攝像機相當於以乙個固定的頻率對連續轉動的螺旋槳片取樣, 當槳片的轉速超過fs/2並繼續提高時, 我們看到的就是混疊干擾下的結果. – 這是題外話.

本文**

訊號的取樣

降取樣 2048hz對訊號來說是過取樣了,事實上只要訊號不混疊就好 滿足尼奎斯特取樣定理 所以可 以對過取樣的訊號作抽取,即是所謂的 降取樣 在現場中取樣往往受具體條件的限止,或者不存在300hz的取樣率,或除錯非常困難等等。若 r 1,則rfs 2就遠大於音訊訊號的最高頻率fm,這使得量化雜訊大部...

與rms 取樣點數對RMS的影響

前言 訊號採集是指將連續的物理量轉化成便於分析的數碼訊號的過程,一般要求所採集的訊號能夠包含足夠的資訊,以便準確表達原有訊號的特徵。本文通過理論推導和例項分析 了如何保證幅值的不失真。理論分析 對於乙個頻率為f的穩態正弦訊號y sin 2 pi f t 根據有效值的定義可知其有效值 例項計算 設一訊...

訊號處理 取樣正弦波的頻率上下限的確定

一 頻率上限 即最高可還原的頻率 首先,我們得準備幾個前提知識 頻率與時間成反比關係,即f 1 t 或 t 1 f 頻率要最高,那麼時間就應該最短。要知道乙個取樣正弦波的頻率,那麼我們至少要在半個週期內有兩個取樣點 夏農取樣定理 結合上面兩個前提可以列式 tn 1 tn 0.5 tmin 其中tn ...