部落格**:
強化學習(reinforcement learning):
所謂強化學習就是智慧型系統從環境到行為對映的學習,以使獎勵訊號(強
化訊號)
函式值最大,強化學習不同於連線主義學習中的監督學習,強化學習中由環境提供的強化訊號是對產生動作的好壞作一種評價(通常為標量訊號),而不是告訴強化學習系統rls(reinforcement learning system)如何去產生正確的動作。由於外部環境提供的資訊很少,rls必須靠自身的經歷進行學習。通過這種方式,rls在行動-評價的環境中獲得知識,改進行動方案以適應環境。
增量學習(incremental learning):
學習新知識,不忘舊知識。
1) 可以從新資料中學習新知識; 2)
以前已經處理過的資料不需要重複處理; 3)
每次只有乙個訓練觀測樣本被看到和學習; 4)
學習新知識的同時能儲存以前學習到的大部分知識; 5)
—旦學習完成後訓練觀測樣本被丟棄; 6)
學習系統沒有關於整個訓練樣本的先驗知識
資料乙個乙個的到來,乙個乙個的學習。
遷移學習(transfor learning):
遷移學習可以從現有的資料遷移知識,用來幫助將來的學習。遷移學習(transfer
learning)的目標是將從乙個環境中學到的知識用來幫助新環境中的學習任務。因此,遷移學習不會像傳統機器學習那樣作同分布假設。
批量學習(batch learning):
資料一批一批的到來,一批一批的學習。
各種機器學習方法的優缺點
樸素貝葉斯的優點 對小規模的資料表現很好,適合多分類任務,適合增量式訓練。缺點 對輸入資料的表達形式很敏感。決策樹的優點 計算量簡單,可解釋性強,比較適合處理有缺失屬性值的樣本,能夠處理不相關的特徵 缺點 容易過擬合 後續出現了隨機森林,減小了過擬合現象 logistic回歸優點 1 實現簡單 2 ...
機器學習方法
根據資料型別的不同,對乙個問題的建模有不同的方式。在機器學習或者人工智慧領域,人們首先會考慮演算法的學習方式。在機器學習領域,有幾種主要的學習方式。將演算法按照學習方式分類是乙個不錯的想法,這樣可以讓人們在建模和演算法選擇的時候考慮能根據輸入資料來選擇最合適的演算法來獲得最好的結果。監督式學習 在監...
機器學習基礎 各種學習方式(28) 元學習方法
meta learning learning to learn 讓機器學習如何學習。元學習學習到的是學習能力,而不是知識本身。智慧型很重要的一方面在於它的多功能性 versatility 即可以處理多種不同事情的能力。而我們人類卻可以在新的未知條件下表現出十分智慧型的行為和適應性。那麼我們如何才能教...