取樣與壓縮感知

2021-07-29 23:52:35 字數 2863 閱讀 2368

光學基礎知識大講堂

——第11期:取樣與壓縮感知

日常生活中,我們通常會遇到這樣的情況,當你看乙個電風扇,剛開始你能分辨得出轉動的方向,速度達到一定程度的時候你已經分辨不出來了,甚至會產生錯覺,似乎扇葉在倒著轉!

圖1 風扇轉動**(**於網路)

其實,這就是取樣的問題。在前面全息技術那一期中也有提到過人眼的視覺滯留效應,當人眼**到某一幀畫面的時候,會停留1/24秒左右的時間,也就是說1秒鐘內如果連續放24幀以上的畫面,那麼你看到的是連續的畫面,反之就是不連續的。再舉個例子,如果一根木棍繞中心點轉動,轉動速度是1秒鐘轉一圈,然後用相機也是每隔1秒鐘拍一張**,那麼你會發現所有的**都是一樣的,然後你認為它沒有動。其實這就是取樣頻率不足導致的錯覺,那取樣頻率達到多少才能真正看清影象呢?

圖2 轉動示意圖(**於網路)

顯然,從上面的例子中可知,取樣頻率起碼是原來的1倍以上才行,那具體多少呢?奈奎斯特取樣定理告訴我們,取樣頻率必須高於原訊號最高頻率的2倍,才能完整保留原始訊號中的資訊。

暫且忘了上面的**,影象不僅僅只有轉動,還有詩和…咳咳…是頻譜。好,關於影象的問題來了,而且還是2個:第一,為啥要取樣啊?第二,影象到底是個啥啊?什麼叫完整保留影象資訊,那什麼叫不完整咧?

首先回答第乙個問題,為啥要取樣。比如要調研乙個龐大的樣品庫,全部調研是不現實的,所以必須採用抽樣的模式進行,否則累死你。對於訊號也一樣,乙個連續訊號是由無數個離散訊號組成,如果要對訊號進行傳輸,就只能採用取樣的方式,否則無論取樣時間還是儲存空間都是無法估量的。

接下來回答第二個問題,影象是啥。換句話說,就是影象的本質是什麼,其實更精確地說應該是物質的本質是什麼?由愛因斯坦的質能方程可以得知,物質是能量的一種表現形式,只不過它是我們看得到的,另外一些能量的表現形式我們看不到,比如熱、非可見光的電磁波等等。那能量又是用什麼來表示?正弦波。又有童鞋要問了,為啥是正弦波,不是方波、三角波或者其他波形來表示,答案是它總要有個波形吧。好吧,開個玩笑(有點冷),真實情況是其他所有的波形都可以用正弦波來表示(用逼近更準確,這個就厲害了),前面某一期中也提到過如何用正弦波合成方波(詳見第5期:什麼是超分辨中的圖3)。

好,現在我們知道了,任何訊號都是由正弦波組成的,從頻域上可以分解成如下圖一樣的很多個頻率成分,高頻代表影象的細節成分,所以如果要真實還原影象,就必須把這所有的頻率成分都包含進去。如果看不懂的童鞋,請先翻看第5期:什麼是超分辨的物理本質部分。

圖3 訊號的傅利葉分析(**於知乎,作者 heinrich)

舉個例子,如果想把一幅含有最高頻率成分為15ω的影象復原,那麼就必須要求取樣後的頻率成分大於15ω,當然取樣頻率高太多也沒有用,因為傳輸後的影象最高水平也只能達到你原影象的畫素。當然,前面只是乙個例子,實際情況傳輸的訊號影象高頻成分都很高,所以你只有可能捨棄掉高頻成分,而不會是全包含。另外乙個方面,人眼本質上也是個探測器,有解析度極限,所以沒有必要要求傳輸影象解析度非常的高,因為再清晰、解析度再高的影象到人眼的解析度最後都一樣。

圖4 畫素較低的(**於網路)

重點來了,如何理解奈奎斯特取樣定理中取樣頻率必須高於2倍最高頻率?高於最高頻率前面已經提到了,必須包含,否則就等同於影象失真,丟失了影象的細節部分。接下來的問題是為什麼是2倍的最高頻率?

我們都知道,訊號是由不同頻率的正弦波組成,那麼我們要探測乙個正弦波,如何做到?最笨的辦法就是把正弦波上的所有點都探測出來,不過那也是不現實的。那因為我們知道是正弦波,而且正弦波是有週期性的,所以我們只需要探測到如下圖的2個點,我們就能確定這個正弦波的樣子了,自然我們就能得到完整的正弦波訊號。所以,我們把這二者結合起來,就變成了奈奎斯特取樣定理:取樣頻率必須高於原訊號最高頻率的2倍,才能完整保留原始訊號中的資訊。

圖5 正弦波取樣圖(**於網路)

---------------------------------------華麗的分割線-----------------------------------------

基礎線性代數知識來了,假設n=1000,m=50,那要找到這麼個矩陣a的條件是什麼,條件是n=1000的矩陣x其中包含了很多個0,否則根本找不到a來獲得m=50的矩陣y。第二個問題,假設找到了上面的矩陣a,那麼下面的公式成不成立?

簡單看下公式的區別,多了最下面一行,顯然公式成立,只不過變成相關的了,資料冗餘了對不對,我不需要最下面那一行資料。所以,壓縮感知理論的兩大特性來了:不相關性和稀疏性(就是原影象矩陣x中含有很多的0)。只有滿足這2個條件,壓縮感知才能把原本1000行的資料通過計算的方式轉換成50行的資料。

神奇吧,好像也還行。那最後乙個問題,我們現實生活中影象都是稀疏的嗎,即換成矩陣寫法的時候會有很多0?答案:是的。舉個例子,我們的原子結構是由什麼構成的?原子核和電子,但是空氣(真空)卻佔據了99.99..%的成分,這是乙個道理。over!!!

圖6 原子結構示意圖(**於網路)

取樣 過取樣和壓縮感知

取樣定理是取樣過程所遵循的規律 又稱取樣定理 抽樣定理 說明取樣頻率與訊號頻譜之間的關係,1928年由美國電信工程師h.奈奎斯特首先提出來的,因此稱為奈奎斯特取樣定理。1948年資訊理論的創始人c.e.夏農對這一定理加以明確說明並正式作為定理引用,因此在許多文獻中又稱為夏農取樣定理。通常訊號或影象的...

取樣 過取樣和壓縮感知

取樣定理是取樣過程所遵循的規律 又稱取樣定理 抽樣定理 說明取樣頻率與訊號頻譜之間的關係,1928年由美國電信工程師h.奈奎斯特首先提出來的,因此稱為奈奎斯特取樣定理。1948年資訊理論的創始人c.e.夏農對這一定理加以明確說明並正式作為定理引用,因此在許多文獻中又稱為夏農取樣定理。通常訊號或影象的...

稀疏表示與壓縮感知

最近在看機器學習時,看到一章關於稀疏學習的,之前有了解過稀疏表示與壓縮感知,但是兩者之間的差異並不是很清楚,今天就總結一下吧 稀疏表示 稀疏域模型 sparse land model 即訊號的稀疏表示,它意欲用盡可能少的非0係數表示訊號的主要資訊,從而簡化訊號處理問題的求解過程。稀疏域模型可如表示式...