目錄
第2章 k-近鄰演算法
第3章 決策樹
第4章 基於概率論的分類方法:樸素貝葉斯
第5章 logistic回歸
第7章 利用adaboost元演算法提高分類效能
第8章 **數值型資料:回歸
1.python console匯入knn.py檔案
>>>import knn
1.reload的使用方法
>>>from imp import reload
>>>reload(...)
2.p45程式清單3-6
firststr = mytree.keys()[0]
更正為
firstsides = list(mytree.keys())
firststr = firstsides[0]
是因為python3改變了dict.keys返回的是dict-keys物件,支援iterable,但不支援indexable。
1.numpy庫的呼叫方法
from numpy import *
import numpy
兩種語句的作用都是引入numpy庫中的所有函式、物件、變數,但第一種可直接呼叫模組,如:random(),第二種的呼叫方式為:numpy.random(),通常應使用第二種語句呼叫numpy,防止與標準庫中的函式名衝突,造成混淆。
2.p65 切分文字
>>>string.split()
string代表字串名。
3.去除切分後產生的空字串
>>>[tok for tok in listoftokens if len(tok) > 0]
4.將字串全部轉換成小寫
>>>[tok.lower() for tok in listoftokens if len(tok) > 0]
5.隨機選擇資料的一部分作為訓練集,而剩餘部分作為測試集的過程稱為留存交叉驗證。
1.p82 **執行後出現錯誤 'range' object doesn't support item deletion
原因:python3 range返回的是range物件,不返回陣列物件
解決方法:在range(m)前加上list,改為list(range(m))。
1.p120 無窮的表示方法
>>>float("inf") #正無窮
>>>float("-inf") #負無窮
①使用inf做簡單的加法、乘法運算仍然會得到inf。
②但0與inf相乘時,會得到not a number(nan)。
③除了inf之外的其他數字除以inf時,會得到0。
④inf與inf相除,會得到not a number(nan)。
1.numpy.linalg模組包含線性代數的函式。
2.numpy.eye()函式生成對角矩陣。
《機器學習實戰》學習筆記
很久沒寫過部落格了,一重開就給自己挖了這麼乙個大坑 最近一段時間看了 機器學習實戰 這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣 京東 亞馬遜等 這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個演算法的python實現 和講解,要求不高的話可以拿來用了 懶 在這...
《機器學習實戰》學習筆記
通過對輸入資料inx和資料集dataset座標距離的計算返回結果 資料集包括group 座標 和labels 分類 計算inx與group點與點的距離 對距離遞增排序 選取排序後的前k個值對應的label 根據label出現的頻率對inx進行分類 def classify0 inx,dataset,...
機器學習實戰筆記
在 機器學習實戰 的決策樹的儲存這方面內容學習過程中,進行 除錯時遇到以下兩個錯誤 1 typeerror write argument must be str,not bytes 2 unicodedecodeerror gbk codec can t decode byte 0x80 in po...