m:訓練樣本的數目
n:特徵的數量
x『s:輸入變/特徵值
y『s:輸出變數/目標變數
(x,y):訓練樣本 ->(x(i),y(i)):訓練集,第i個訓練樣本,i=1,2..,m
定義:(口頭表達,非正式)我們給學習演算法乙個資料集,這個資料集由「正確答案」組成,它的目標是給定某個訓練集,需要學習某個函式h:x->y(x到y的對映), 使得h(x)就是乙個「好」的**器,能夠給出相應的輸出值y。函式h稱為hypothesis。
解釋:首先通過訓練集來學習出乙個演算法得到乙個假設函式h,然後利用假設函式來完成x到y的最好對映。
假定我們有乙個資料集,它給出了居住地和房子**的關係,如下**所示:
假設上面的資料有47組,影象如下圖所示:
這樣根據我們上面給出的訓練集我們要經過乙個學習演算法,得到乙個假設函式,使得這個假設函式能更好的擬合我們給出的資料,從而在以後當我們給出房屋的大小時能更好的**房屋的**。
如上圖所示,假設我們得出的假設函式是乙個線性的,這樣上面的函式明顯比下面相對於我們給出的樣本能夠更好的擬合。這就是乙個監督問題。
當我們想要**的輸出值為連續的,例如上例中我們的輸出值是**,那麼該學習問題為乙個回歸(regression)問題。當輸出值y僅能在乙個有限的離散值集合中取值,我們稱之為分類(classification)問題。
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...
監督學習,無監督學習和半監督學習
監督學習 supervised learning 無監督學習 unsupervised learning 半監督學習 semi supervised learning 2 概念 監督學習 用一部分已知分類 有標記的樣本來訓練機器後,讓它用學到的特徵,對沒有還分類 無標記的樣本進行分類 貼標籤。一句話...
監督學習 非監督學習 半監督學習(主動學習)
統計學習通常包括監督學習 非監督學習 半監督學習以及強化學習,在機器學習的領域中前三種研究的比較多的,也是運用的比較廣泛的技術。監督學習的任務是學習乙個模型,使模型對給定的任意的乙個輸入,對其都可以對映出乙個 結果。這裡模型就相當於我們數學中乙個函式,輸入就相當於我們數學中的x,而 的結果就相當於數...