壓縮 會是機器學習的下乙個殺手級應用嗎?

2021-08-31 06:50:48 字數 1010 閱讀 6689

機器學習的研究正進行的如火如荼,各種新方法層出不窮。儘管這樣,還有乙個問題擺在面前,研究這些演算法對於現實有什麼用。特別是當討論起機器學習在手機和其他裝置上的應用時,經常會被問到到:「機器學習有什麼殺手級應用?」

我認為機器學習非常適合於壓縮演算法的另乙個原因是,我們最近在自然語言處理中得到了很多有趣的結果。如果你仔細琢磨的話,其實是可以將影象描述看作是的一種終極壓縮方法。我一直以來都希望建立乙個專案,乙個能夠以每秒一幀的速度給照相機拍下的配上描述文字,之後將這些描述文字寫入到日誌檔案中。通過這個就能夠得到乙個非常簡單的故事,講述著相機隨著時間的推移看到了什麼。我認為這就可以看作乙個能夠敘事的感測器。

我將這種東西叫做壓縮的原因是,我們其實可以使用乙個生成神經網路來根據字幕生成。這個生成出的並不一定要與輸入完全一樣,只要它們具有同樣的意思就可以了,這就可以看作是乙個解壓縮演算法。如果想要輸出的結果與輸入盡可能相似的壓縮演算法,可以參考影象風格化的演算法,將壓縮為每個場景的輪廓線。這些演算法與傳統壓縮演算法的共同之處在於,它們找到了輸入中對於我們人類最重要的資訊,而忽略了其他的細枝末節。

語言世界也有類似的趨勢。語音識別技術正在迅速改進,合成語音的能力也在迅速提高。識別過程可以看作是將音訊壓縮為自然語言文字的過程,而合成則正好反過來。而人之間的對話可以通過將音訊翻譯為文字表示而的到極大的壓縮。我現在還很難想象是否需要走那麼遠,但是似乎有可能通過我們對與語言特徵的新理解來實現更好的壓縮質量以及更低的頻寬。

我甚至看到了將機器學習壓縮演算法應用到文字本身的可能。andrej karpathy 的 char-rnn(展示了神經網路可以很好的模擬給定樣本的風格,這種學習風格的本質與壓縮問題是很相似的。如果考慮一下典型的 html 頁面有多少冗餘,機器學習壓縮演算法其實有很好的機會去改進 gzip。但這只是我的乙個猜想,畢竟我沒有機器學習文字壓縮的經驗。

頻寬成本需要平攤到使用者和運營商身上,而質量和續航是產品的一大賣點,因此採用機器學習進行壓縮相比於其他應用方向有更直接的動機。現有的研究表明,機器學習演算法進行壓縮非常的高效,而且我樂觀的認為還有很多方法等著被發現,所以我希望壓縮演算法會成為機器學習的乙個重要應用。

**:

Android會是下乙個Linux?

近年來,智慧型手機終端市場的快速增長成為了大勢所趨。國外手機市場調研機構的 顯示,2010 年的全球手機市場整體出貨量將相較去年增長11.3 但其中智慧型手機整體出貨量和去年同比增長率卻高達35.5 的智慧型手機霸主諾基亞依然以接近40 的銷售份額領跑市場,市場佔比相當於第二名的rim 黑莓和第三名...

MID會是下乙個熱點嗎?

過去的一年,netbook 上網本 火了,以iphone為代表的智慧型手機也火了。那麼,夾在上網本與智慧型手機之間的移動網際網路裝置 mobile internet device,下稱mid 是不是也有機會火起來?很多電腦廠商在關注mid,比如戴爾電腦。其主要從事的pc 個人電腦 業在過去的一年可謂...

WebGame 網頁遊戲 會是下乙個趨勢嗎?

webgame 網頁遊戲 會是下乙個趨勢嗎?最近 webgame 一詞似乎很火,有人問 網際網路冬天裡的企業 能否根據 webgame 過冬呢?下面我的一下意見,請拍磚.首先來問兩個問題 webgame是否會像第一波網際網路那樣興起,變成乙個賺錢的工具,甚至變成是像乙個當時簡訊那樣,救活網際網路度過...