是否有監督(supervised),就看輸入資料是否有標籤(label)。輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習
這裡我參考網路資料將機器學習分為;有監督學習、無監督學習、半監督學習和強化學習四類。
回歸(regression):
其資料集是給定乙個函式和它的一些座標點,然後通過回歸分析的演算法,來估計原函式的模型,求出乙個最符合這些已知資料集的函式,從而**未知輸入的輸出值。
分類和回歸的主要區別就是輸出結果是離散的還是連續的。
聚類:把相似的東西聚在一起,並不需要知道類別是什麼
訓練資料是無標籤的,訓練目標是能對資料進行區分和界定
是監督學習與無監督學習相結合的一種學習方法。半監督學習使用大量的未標記資料,以及同時使用標記資料,來進行模式識別工作。
它主要考慮如何利用少量的標註樣本和大量的未標註樣本進行訓練和分類的問題。主要分為半監督分類,半監督回歸,半監督聚類和半監督降維演算法。
摘自:強化學習演算法的思路非常簡單,以遊戲為例,如果在遊戲中採取某種策略可以取得較高的得分,那麼就進一步「強化」這種策略,以期繼續取得較好的結果。這種策略與日常生活中的各種「績效獎勵」非常類似。我們平時也常常用這樣的策略來提高自己的遊戲水平。
這就是乙個典型的強化學習場景:
機器有乙個明確的小鳥角色——**
需要控制小鳥飛的更遠——目標
整個遊戲過程中需要躲避各種水管——環境
躲避水管的方法是讓小鳥用力飛一下——行動
飛的越遠,就會獲得越多的積分——獎勵
強化學習和監督學習、無監督學習 最大的不同就是不需要大量的「資料餵養」。而是通過自己不停的嘗試來學會某些技能。
參考
如reinforcement-learning
有監督學習和無監督學習 無監督學習
一.無監督學習包含的演算法 聚類 kmeans聚類演算法 降維 pca 之所以叫無監督學習 是因為模型是從無標籤的資料開始學習,沒有目標值。二.kmeans聚類 1.聚類演算法步驟 定義 將高維資料轉化為低維資料的過程,在此過程中可能會捨棄原有資料,創造新的變數 作用 降低原始資料的維數 複雜度 損...
有監督學習和無監督學習
機器學習的常用方法,主要分為有監督學習 supervised learning 和無監督學習 unsupervised learning 監督學習,就是人們常說的分類,通過已有的訓練樣本 即已知資料以及其對應的輸出 去訓練得到乙個最優模型 這個模型屬於某個函式的集合,最優則表示在某個評價準則下是最佳...
有監督學習 無監督學習與半監督學習
這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。但根據知乎慣例,答案還是要繼續擴充套件的。首先看什麼是學習 learning 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必...