目錄:
meta learning的出現
meta learning,元學習,也叫 learning to learn(學會學習)。是繼reinforcement learning(增強學習)之後又乙個重要的研究分支,它的發展歷程和動因可以歸納如下圖:
舉個例子,把棋盤變大之後alphago還能行嗎?目前的方法顯然是不行的,alphago會立馬變成傻瓜。而我們人類分分鐘就可以適應新的棋盤。再比如人臉識別,我們人往往可以只看一面就能記住並識別,而現在的深度學習卻需要成千上萬的進行訓練之後才能做到。
人類之所以能夠快速學習的關鍵是人類具備學會學習的能力,能夠充分的利用以往的知識經驗來指導新任務的學習。因此meta learning成為了新的攻克方向,核心問題就是要讓人工智慧自己學會思考,學會推理。
我們在現實生活中往往會遇到很多新任務,現在的深度學習因為無法快速適應新任務,就沒辦法替代人類工作。而一旦ai具備了這種快速學習的能力,例如機械人,才能夠真正走進千家萬戶。因為每個人對機械人的使用都不一樣,每個家庭的環境也都不一樣,只有機械人具備了快速學習的能力,不需要預先訓練,才能適應各種各樣的要求。
因此,要讓機械人走進千家萬戶,我們需要機械人能夠實時學習,不斷學習,快速學習,即使面對乙個新的類似的任務,也能快速掌握。這樣的機械人會非常強大,能真正處理各種任務!
因此,在深度增強學習的大框架下,我們還需要:
終生學習life long learning
少樣本學習few shot learning
多工學習multi task learning
多智慧型體學習multi agent learning
學會學習meta learning/learning to learn
遷移學習transfer learning
也就是說,從機械人的角度,我們希望機械人能夠實現的智慧型決策需要具備以下幾點:
能夠不斷通過與環境互動來學習提公升決策能力,也就是終生學習
能夠快速學習,面對新的任務,可以通過少量的訓練就掌握
可以處理多種任務
可以實現多智慧型體的協作完成任務
能夠學會學習,這和快速學習本質是一樣的,就是發現學習規律,面對新任務可以快速入手
這也和快速學習的目標一致,希望通過遷移以往學習的經驗來加速新任務的學習。
這都是一些研究分支,但目的都是希望機械人能夠和人類一樣具備快速學習的能力,能夠累積經驗,這樣的機器人才有可能具備強大的智慧型決策能力。但是,快速學習,或者說學會學習meta learning應該是最關鍵的技術,是實現通用人工智慧agi的必經之路!
初識機器學習
學機器學習已經大半年了,現在才發現自己是初識機器學習。一開始學機器學習,真的以為它是個機器,學會了就可以拿來用,或是拿來改進。現在才明白,學機器學習的方法不僅要弄明白理論基礎和演算法思路,還要明白演算法的脈絡,它的每一步都是為什麼這麼做,掌握演算法背後的真正的思想,才能融會貫通,針對不同的問題提出不...
初識機器學習
機器學習 資料 資料 做為輸入 輸出 找到最合適的演算法公式 機器學習的分類 有批量 batch 數量的情況下可應用 監督式學習 知道輸入與輸出 半監督式學習是 知道輸入與部分輸出 無監督式學習 不知道輸出 對應著聚類 clustering 對於機器學習的輸出 1.有明確的分類 是 否 並且是用一條...
初識機器學習
機器學習的定義 1 在沒有明確設定的情況下,使計算機具有學習能力 samuel 2 電腦程式從經驗e中學習,解決某一任務t,進行某一效能度量p,通過p測定在t上的表現因經驗e而提高 tom mitchell 學習下棋是e,下贏是t,獲勝的概率是p。通過在下棋 t 中提高經驗 e 從而增加獲勝的概率 ...