監督學習的兩個任務:分類和回歸分析(**數值型資料)。
分類方法思路:這個表至關重要,叫做特徵向量表
特徵1特徵2
…目的變數(類別)
例項1………
…例項2……
…………
………如上表,分類思路如下:
用大量的已分類資料(其目標變數的值已給出)組成的訓練集進行訓練,該訓練集由若干個訓練樣本構成,每個訓練樣本是乙個例項
測試樣本(不提供目標變數)
比較目標變數的**值和實際樣本的目標變數值,計算得到演算法的精確度。
監督學習的另乙個任務是回歸分析。
無目標變數(無類別資訊),其主要任務有:
聚類:將資料集合分成由類似的物件組成的多個類的過程;
密度估計:尋找描述資料統計值的過程
減少資料特徵的維度,方便用2/3維圖形直觀展示資料資訊
監督學習的用途
k-近鄰演算法
樸素貝葉斯演算法
支援向量機
決策樹線性回歸
區域性加權線性回歸
ridge回歸
lasso最小回歸係數估計
其中深橙色表示分類演算法,淺藍色表示回歸分析演算法。
無監督學習的用途
k-均值
最大期望演算法
dbscan
parzen窗設計
本書不包括pagerank演算法(google的演算法),最大期望演算法。
1 如何選擇演算法:
2 開發機器學習的步驟:
* 收集資料:爬蟲、rss反饋、感測器資料,api中的資訊。
* 準備輸入資料。格式為python的list格式。
* 分析輸入資料:人工檢查輸入資料的數值是否異常。
* 訓練演算法:無監督學習不需要訓練演算法。
* 測試演算法:評估演算法,測試演算法工作的效果。
* 將機器學習演算法轉換為應用程式,執行實行任務。
機器學習實戰學習筆記 1 基礎
1,什麼是機器學習 機器學習,簡單說就是要把無序的資料,轉化為人們可以識別的有用的資料。2,機器學習需要哪些基礎知識 機器學習橫跨很多學科領域,包括但不限於 計算機,數理統計,工程技術等。3,什麼時候可以用機器學習 一般我們寫 解決問題,結果或者計算過程具有確定性。比如計算完全數,水仙花數,或者保險...
機器學習實戰(1)
from numpy import import operator def createdataset object group array 1.0,1.0 1.0,1.1 0,0 0,0.1 labels a a b b return group,labels def classify0 inx,...
《機器學習實戰》學習筆記
很久沒寫過部落格了,一重開就給自己挖了這麼乙個大坑 最近一段時間看了 機器學習實戰 這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣 京東 亞馬遜等 這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個演算法的python實現 和講解,要求不高的話可以拿來用了 懶 在這...