很久沒寫過部落格了,一重開就給自己挖了這麼乙個大坑……
最近一段時間看了《機器學習實戰》這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣、京東、亞馬遜等**,這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個演算法的python實現**和講解,要求不高的話可以拿來用了(懶)。在這裡想好好寫寫從這本書中學到的東西,文中的**和主要內容也將均來自這本書。目錄
第一部分 分類
第1章 機器學習基礎
第2章 k-近鄰演算法
第3章 決策樹
第4章 基於概率論的分類方法:樸素貝葉斯
第5章 logistic回歸
第6章 支援向量機
第7章 利用adaboost元演算法提高分類效能
第二部分 利用回歸**數值型資料
第8章 **數值型資料:回歸
第9章 樹回歸
第三部分 無監督學習
第10章 利用k-均值聚類演算法對未標註資料分組
第11章 使用apriori演算法進行關聯分析
第12章 使用fp-growth演算法來高效發現頻繁項集
第四部分 其他工具
第13章 利用pca來簡化資料
第14章 利用svd簡化資料
第15章 大資料與mapreduce
此書的主頁:
書中的**和所使用的資料集可以在主頁或者這裡(作者的github版本庫)找到。
書中有的**均使用python 2.7,並廣泛使用了numpy模組,若干章中還使用了matplotlib模組進行繪圖。可以安裝python 2.7的官方發行版,然後依次安裝numpy和matplotlib模組(需要解決依賴)。在這裡推薦直接安裝python發行版anaconda,已經內建了很多科學計算所需的模組,可直接使用。
《機器學習實戰》學習筆記
目錄 第2章 k 近鄰演算法 第3章 決策樹 第4章 基於概率論的分類方法 樸素貝葉斯 第5章 logistic回歸 第7章 利用adaboost元演算法提高分類效能 第8章 數值型資料 回歸 1.python console匯入knn.py檔案 import knn1.reload的使用方法 fr...
《機器學習實戰》學習筆記
通過對輸入資料inx和資料集dataset座標距離的計算返回結果 資料集包括group 座標 和labels 分類 計算inx與group點與點的距離 對距離遞增排序 選取排序後的前k個值對應的label 根據label出現的頻率對inx進行分類 def classify0 inx,dataset,...
機器學習實戰筆記
在 機器學習實戰 的決策樹的儲存這方面內容學習過程中,進行 除錯時遇到以下兩個錯誤 1 typeerror write argument must be str,not bytes 2 unicodedecodeerror gbk codec can t decode byte 0x80 in po...