監督學習(supervised learning)的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的**。即:利用訓練資料集學習乙個模型,再用模型對測試樣本集進行**。例如kaggle上的鐵達尼號比賽。
官方提供旅客資料——資料集1(姓名,年齡,性別,社會經濟階層,是否生存等),要求參賽選手建立乙個**模型來回答「另外418名乘客是否會生存?」這是乙個典型的監督學習(supervised learning)的例子。因為該訓練資料有輸入物件(姓名,年齡,性別,社會經濟階層等)和預期輸出(是否生存)。有無預期輸出是監督學習(supervised learning)與非監督學習(unsupervised learning)的區別。
我們的任務是根據資料集1建立乙個**模型(model),即學習演算法(learning algorithm)。這個過程稱為「學習(learning)」或「訓練(training)」。由於我們得到的學得模型只是接近了資料的某種潛在規律,因此被稱為『假設(hypothesis)』。相對應的,潛在規律自身則被稱為『真實(ground-truth)』。學習的目的就在於找到最好的『假設(hypothesis)』。用學習演算法(learning algorithm)對資料集2的每個例項(姓名,年齡,性別,社會,社會經濟階層等)進行判斷——『是否能生存?』。
這是乙個二分類任務(輸出為『生存』或『死亡』兩個維度)。如果所需結果為『生存』,『半生半死』或『死亡』等多個維度,則為多分類任務。如果所需結果為生存率(0~1),則為回歸任務(輸出結果為連續值)。
分類問題(離散)與回歸問題(連續)等都是監督學習。
分類問題:
回歸問題:
非監督學習(unsupervised learning)為直接對資料進行建模。沒有給定事先標記過的訓練範例,所用的資料沒有屬性或標籤這一概念。事先不知道輸入資料對應的輸出結果是什麼。自動對輸入的資料進行分類或分群,以尋找資料的模型和規律。如聚類演算法:針對資料集,自動找出資料中的結構,從而把資料分成不同的簇。例如:谷歌新聞利用聚類演算法把不同的主題放在一起。
無監督學習(unsupervised learning)的優點:由於沒有標準的分類方法,有可能從資料中挖出啟發與亮點。
資料監督與非監督
資料分析的基礎知識內容 什麼是監督學習 在監督學習中,計算機通過示例學習。它從過去的資料中學習,並將學習的結果應用到當前的資料中,以 未來的事件。在這種情況下,輸入和期望的輸出資料都有助於 未來事件 二 所有監督學習演算法本質上都是複雜演算法,分為分類或回歸模型。1.回歸模型 回歸模型用於輸出變數為...
機器學習基本概念 有監督學習和無監督學習
有監督學習是指我們給演算法乙個資料集,並且給定正確的答案。現在有一套房子的面積是750平,請問該套房子 多少合適?如果我們根據這些資料計算出圖中的藍色線,這樣估計該房子大約值160k 而如果我們根據這些資料擬合出黑色曲線,用該曲線計算的話,該套房子的 大約在220k左右。怎麼才能給出乙個最準確的結果...
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...