初識元學習 Meta learning

meta learning的出現

meta learning，元學習，也叫 learning to learn（學會學習）。是繼reinforcement learning（增強學習）之後又乙個重要的研究分支，它的發展歷程和動因可以歸納如下圖：

舉個例子，把棋盤變大之後alphago還能行嗎？目前的方法顯然是不行的，alphago會立馬變成傻瓜。而我們人類分分鐘就可以適應新的棋盤。再比如人臉識別，我們人往往可以只看一面就能記住並識別，而現在的深度學習卻需要成千上萬的進行訓練之後才能做到。

人類之所以能夠快速學習的關鍵是人類具備學會學習的能力，能夠充分的利用以往的知識經驗來指導新任務的學習。因此meta learning成為了新的攻克方向，核心問題就是要讓人工智慧自己學會思考，學會推理。

我們在現實生活中往往會遇到很多新任務，現在的深度學習因為無法快速適應新任務，就沒辦法替代人類工作。而一旦ai具備了這種快速學習的能力，例如機械人，才能夠真正走進千家萬戶。因為每個人對機械人的使用都不一樣，每個家庭的環境也都不一樣，只有機械人具備了快速學習的能力，不需要預先訓練，才能適應各種各樣的要求。

因此，要讓機械人走進千家萬戶，我們需要機械人能夠實時學習，不斷學習，快速學習，即使面對乙個新的類似的任務，也能快速掌握。這樣的機械人會非常強大，能真正處理各種任務！

因此，在深度增強學習的大框架下，我們還需要：

終生學習life long learning

少樣本學習few shot learning

多工學習multi task learning

多智慧型體學習multi agent learning

學會學習meta learning/learning to learn

遷移學習transfer learning

也就是說，從機械人的角度，我們希望機械人能夠實現的智慧型決策需要具備以下幾點：

能夠不斷通過與環境互動來學習提公升決策能力，也就是終生學習

能夠快速學習，面對新的任務，可以通過少量的訓練就掌握

可以處理多種任務

可以實現多智慧型體的協作完成任務

能夠學會學習，這和快速學習本質是一樣的，就是發現學習規律，面對新任務可以快速入手

這也和快速學習的目標一致，希望通過遷移以往學習的經驗來加速新任務的學習。

這都是一些研究分支，但目的都是希望機械人能夠和人類一樣具備快速學習的能力，能夠累積經驗，這樣的機器人才有可能具備強大的智慧型決策能力。但是，快速學習，或者說學會學習meta learning應該是最關鍵的技術，是實現通用人工智慧agi的必經之路！

初識元學習 Meta learning

初識機器學習

初識機器學習

初識機器學習

初識元學習 Meta learning

初識機器學習

初識機器學習

初識機器學習

相關推薦