在歐幾里德空間(例如,ℝnrn 中的向量空間)中是否存在一種符號屬性,可以表示出(任意構建的)原始物件?這被稱為表徵學習(representation learning)。
例如我們希望找到城市的向量表示,從而可以進行這樣的向量運算:羅馬 - 義大利 + 法國 = 巴黎。
機器學習旨在自動地學到從資料的表示(representation)到資料的標記(label)的對映。隨著機器學習演算法的日趨成熟,人們發現,在某些領域(如影象、語音、文字等),如何從資料中提取合適的表示成為整個任務的瓶頸所在,而資料表示的好壞直接影響後續學習任務(所謂garbage in,garbage out)。與其依賴人類專家設計手工特徵(難設計還不見得好用),表示學習希望能從資料中自動地學到從資料的原始形式到資料的表示之間的對映。
而dl就是不用手工選取,深度學習就是學習表徵。
2013 年,yann lecun 和 yosha bengio 發起這個會議,是因為存在這種需求—— 在乙個新的、小的、高質量的場所,集中討論深度方法。為什麼這個會議被稱為「學習表徵(learning representations)」呢?因為以端到端的方式訓練的典型深度神經網路,事實上學習的是這樣的中間表徵(intermediate representations)。傳統的淺層方法是以可訓練分類器之上、人工處理過的特徵為基礎;但是,深度方法學習的是乙個層級網路,它不僅學習那些高度渴望的特徵,也學習分類器。所以,當模糊特徵和分類器之間的界限時,你能得到什麼?你得到了表徵學習(representation learning)。而深度學習也就是這麼一回事。
機器學習基礎 各種學習方式(17) 度量學習
距離的度量對眾多機器學習方法的效能都起到了決定性作用 例如在分類方法中,k近鄰分類器 使用了高斯核的核方法 在聚類方法中,k均值聚類 譜聚類方法都與距離度量密切相關。卡內基梅隆大學機器學習系的邢波教授於2003年提出了距離度量學習。乙個好的距離度量能夠根據資料的結構與分布適用於不同的應用。一般的距離...
機器學習基礎 各種學習方式(28) 元學習方法
meta learning learning to learn 讓機器學習如何學習。元學習學習到的是學習能力,而不是知識本身。智慧型很重要的一方面在於它的多功能性 versatility 即可以處理多種不同事情的能力。而我們人類卻可以在新的未知條件下表現出十分智慧型的行為和適應性。那麼我們如何才能教...
機器學習基礎 機器學習基礎引入
機器學習 是人工智慧的核心研究領域之一,其最初的研究動機是為了讓計算機系統具有人的學習能力以便實現人工智慧。事實上,由於 經驗 在計算機系統中主要是以資料的形式存在的,因此機器學習需要設法對資料進行分析,這就使得它逐漸成為智慧型資料分析技術的創新源之一。機器學習是構建複雜系統的一種方法,也許依靠我們...