今天閱讀邱錫鵬教授的蒲公英書,對表示學習有了更清楚的認知。
為了提高機器學習系統的準確率,需要將輸入資訊轉換為有效的特徵,或者更一般性地稱為表示(representation)。如果有一種演算法可以自動地學習出有效的特徵,並提高最終機器學習模型的效能,那麼這種學習就可以叫作表示學習(representation learning)
表示學習的關鍵是解決語義鴻溝問題。語義鴻溝問題是指輸入資料的底層特徵和高層語義資訊之間的不一致性和差異性。
以顏色為例,以不同的名字來命名不同的顏色,這種表示方式叫作區域性表示,也稱離散表示或符號表示。通常表示為one-hot向量的形式。
同樣以顏色為例,用rgb值來表示顏色,不同顏色對應到r、g、b三維空間中乙個點,這種表示方式叫作分布式表示,分布式表示通常為低緯的稠密向量。
我們可以通過神經網路將高緯的區域性表示空間對映到乙個非常低緯的分布式表示空間。在機器學習中,這個過程也稱為嵌入(embedding),通常指將乙個度量空間中的一些物件對映到另乙個低緯的度量空間中,並盡可能保持不同物件之間的拓撲關係。
要學習到一種好的高層語義表示(一般為分布式表示),通常需要從底層特徵開始,經過多步非線性轉換才能得到。
深層結構的有點是可以增加特徵的重用性,從而指數級地增加表示能力。
因此,表示學習的關鍵是構建具有一定深度的多層次特徵表示。
梁一文寒假學習報告
1.19 html a元素 1.20 html 路徑的寫法 1.21 html 元素 1.22 休息一天 html hyper text markup language 超文字標記語言 定義網頁中有什麼 html是w3c定義的語言標準 html是用於描述頁面結構的語言。css cascading s...
一文搞定開發學習環境
剛開始學寫 首先要搭建開發環境。新手需要在網上查閱教程,很多時候會遇到各種問題,甚至導致自己的學習進度卡住,學習熱情也因此而減少,這實在是個讓人煩的事情。我們可以簡單分析原因,並慢慢減少此類問題的發生。搭建開發環境經常出錯的原因 1.開發環境不匹配 我們在學習或者實際的開發中,有多種開發平台,比如w...
一文深入理解協同過濾
寫在之前 從這篇文章開始,我的下乙個演算法職業生涯方向將專注於推薦演算法 看了那麼多書和 還是peter 的那本 機器學習實戰 最為經典,說實話很多中國人寫的書確實不怎麼樣 那麼,開始吧.本文 從趙志勇的那本書上修改而來,估計趙志勇的那篇文章也是從 機器學習實戰 那本書修改而來,反正總是修改修改 那...