有趣的是,在某些特定的場合,上述第一件事情是自動得到滿足的。最典型的例子就是醫學影象成像,例如斷層掃瞄(ct)技術和核磁共振(mri)技術。對這兩種技術稍有了解的人都知道,這兩種成像技術中,儀器所採集到的都不是直接的影象畫素,而是影象經歷過全域性傅利葉變換後的資料。也就是說,每乙個單獨的資料都在某種程度上包含了全影象的資訊。在這種情況下,去掉一部分採集到的資料並不會導致一部分影象資訊永久的丟失(它們仍舊被包含在其它資料裡)。這正是我們想要的情況。
上述第二件事就要歸功於陶哲軒和坎戴的工作了。他們的工作指出,如果假定訊號(無論是影象還是聲音還是其他別的種類的訊號)滿足某種特定的「稀疏性」,那麼從這些少量的測量資料中,確實有可能還原出原始的較大的訊號來,其中所需要的計算部分是乙個複雜的迭代優化過程,即所謂的「l1-最小化」演算法。
把上述兩件事情放在一起,我們就能看到這種模式的優點所在。它意味著:我們可以在採集資料的時候只簡單採集一部分資料(「壓縮感知」),然後把複雜的部分交給資料還原的這一端來做,正好匹配了我們期望的格局。在醫學影象領域裡,這個方案特別有好處,因為採集資料的過程往往是對病人帶來很**煩甚至身體傷害的過程。以 x 光斷層掃瞄為例,眾所周知 x 光輻射會對病人造成身體損害,而「壓縮感知」就意味著我們可以用比經典方法少得多的輻射劑量來進行資料採集,這在醫學上的意義是不言而喻的。
這一思路可以擴充套件到很多領域。在大量的實際問題中,我們傾向於盡量少地採集資料,或者由於客觀條件所限不得不採集不完整的資料。如果這些資料和我們所希望重建的資訊之間有某種全域性性的變換關係,並且我們預先知道那些資訊滿足某種稀疏性條件,就總可以試著用類似的方式從比較少的資料中還原出比較多的訊號來。到今天為止,這樣的研究已經拓展地非常廣泛了。但是同樣需要說明的是,這樣的做法在不同的應用領域裡並不總能滿足上面所描述的兩個條件。有的時候,第乙個條件(也就是說測量到的資料報含訊號的全域性資訊)無法得到滿足,例如最傳統的攝影問題,每個感光元件所感知到的都只是一小塊影象而不是什麼全域性資訊,這是由照相機的物理性質決定的。為了解決這個問題,美國 rice 大學的一部分科學家正在試圖開發一種新的攝影裝置(被稱為「單畫素照相機」),爭取用盡量少的感光元件實現盡量高解析度的攝影。有的時候,第二個條件(也就是說有數學方法保證能夠從不完整的資料中還原出訊號)無法得到滿足。這種時候,實踐就走在了理論前面。人們已經可以在演算法上事先很多資料重建的過程,但是相應的理論分析卻成為了留在數學家面前的課題。
但是無論如何,壓縮感知所代表的基本思路:從盡量少的資料中提取盡量多的資訊,毫無疑問是一種有著極大理論和應用前景的想法。它是傳統資訊理論的乙個延伸,但是又超越了傳統的壓縮理論,成為了一門嶄新的子分支。它從誕生之日起到現在不過幾年時間,其影響卻已經席捲了大半個應用科學。
編碼通俗解釋
很久很久以前,有一群人,他們決定用8個可以開合的電晶體來組合成不同的狀態,以表示世界上的萬物。他們看到8個開關狀態是好的,於是他們把這稱為 位元組 再後來,他們又做了一些可以處理這些位元組的機器,機器開動了,可以用位元組來組合出很多狀態,狀態開始變來變去。他們看到這樣是好的,於是它們就這機器稱為 計...
LDA通俗解釋
lda整體流程 先定義一些字母的含義 lda以文件集合d作為輸入 會有切詞,去停用詞,取詞幹等常見的預處理,略去不表 希望訓練出的兩個結果向量 設聚成k個topic,voc中共包含m個詞 lda的核心公式如下 p w d p w t p t d 直觀的看這個公式,就是以topic作為中間層,可以通過...
通俗解釋挖礦
位元幣本質上並不是乙個 幣 而是乙個記賬系統而已,而這個記賬系統中的最大單位,就是 1btc 而這個記賬系統,其實是需要委託乙個人來幫大家記總賬,記好了以後再把賬本複製分發到每個人手裡,然後這個系統會給這個記賬人一點工資作為獎勵。這個記賬人,就是礦工。那麼這裡就有了乙個問題了,我們怎麼保證這個記賬人...