1.監督和無監督學習
監督學習:對事物未知表現的**(分類、回歸)其中分類是離散已知數量的**,回歸是連續變數的**。一般使用兩種型別的目標變數:標稱型和數值型。
無監督學習:對事物本身性質的分析(降維、聚類)
2.標稱型和數值型資料
標稱型:標稱型目標變數的結果在有限目標集中取值,如真與假(標稱型目標變數主要用於分類)
數值型:數值型目標變數可以從無限的數值集合中取值(數值型目標變數主要用於回歸分析)
3.在監督學習中主要有兩種資料分類方法:
驗證集合測試集的區別:驗證集主要是用來進一步確定模型中的引數(正則項係數、隱含層節點個數),而測試集主要是用來評估模型的精確度(泛化能力)。
對於第一種方法即首先用取得最小誤差的驗證集的引數取值模型作為所選的最佳模型,然後採用測試集對這個最佳模型進行評價。第二種方法直接對最小誤差的測試集作為評價並不合理,因為這個模型本來就是最為滿足的模型。
監督學習和非監督學習
重新看一遍ng的機器學習課程,第一次寫讀書筆記,希望能夠堅持下來!對於監督學習,首先來看乙個例子,如下圖.圖中的資料來自r語言中的boston資料集,其中lstat軸表示地位較低的人口比重,medv軸表示median value of owner occupied homes in 1000s。如果...
監督學習和非監督學習
監督學習 監督學習就是分類,把人們已經處理好的訓練樣本 即已知資料和對應輸出 給計算機,計算機通過規律訓練出乙個最佳模型,再用這個模型對輸入的資料進行分類,得出對應的輸出。從而使計算機具有對未知資料進行分類的功能。特點 目標明確 需要帶標籤的訓練樣本 分類效果很容易評估 非監督學習 非監督學習沒有訓...
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...