機器學習實戰筆記 1 機器學習基礎

2022-07-25 21:51:11 字數 1089 閱讀 9116

監督學習的兩個任務:分類回歸分析(**數值型資料)。

分類方法思路:這個表至關重要,叫做特徵向量表

特徵1特徵2

…目的變數(類別)

例項1………

…例項2……

…………

………如上表,分類思路如下:

用大量的已分類資料(其目標變數的值已給出)組成的訓練集進行訓練,該訓練集由若干個訓練樣本構成,每個訓練樣本是乙個例項

測試樣本(不提供目標變數)

比較目標變數的**值和實際樣本的目標變數值,計算得到演算法的精確度。

監督學習的另乙個任務是回歸分析。

無目標變數(無類別資訊),其主要任務有:

聚類:將資料集合分成由類似的物件組成的多個類的過程;

密度估計:尋找描述資料統計值的過程

減少資料特徵的維度,方便用2/3維圖形直觀展示資料資訊

監督學習的用途

k-近鄰演算法

樸素貝葉斯演算法

支援向量機

決策樹線性回歸

區域性加權線性回歸

ridge回歸

lasso最小回歸係數估計

其中深橙色表示分類演算法,淺藍色表示回歸分析演算法。

無監督學習的用途

k-均值

最大期望演算法

dbscan

parzen窗設計

本書不包括pagerank演算法(google的演算法),最大期望演算法。

1 如何選擇演算法:

2 開發機器學習的步驟:

* 收集資料:爬蟲、rss反饋、感測器資料,api中的資訊。

* 準備輸入資料。格式為python的list格式。

* 分析輸入資料:人工檢查輸入資料的數值是否異常。

* 訓練演算法:無監督學習不需要訓練演算法。

* 測試演算法:評估演算法,測試演算法工作的效果。

* 將機器學習演算法轉換為應用程式,執行實行任務。

機器學習實戰學習筆記 1 基礎

1,什麼是機器學習 機器學習,簡單說就是要把無序的資料,轉化為人們可以識別的有用的資料。2,機器學習需要哪些基礎知識 機器學習橫跨很多學科領域,包括但不限於 計算機,數理統計,工程技術等。3,什麼時候可以用機器學習 一般我們寫 解決問題,結果或者計算過程具有確定性。比如計算完全數,水仙花數,或者保險...

機器學習實戰(1)

from numpy import import operator def createdataset object group array 1.0,1.0 1.0,1.1 0,0 0,0.1 labels a a b b return group,labels def classify0 inx,...

《機器學習實戰》學習筆記

很久沒寫過部落格了,一重開就給自己挖了這麼乙個大坑 最近一段時間看了 機器學習實戰 這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣 京東 亞馬遜等 這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個演算法的python實現 和講解,要求不高的話可以拿來用了 懶 在這...