《機器學習實戰》學習筆記

2021-09-11 18:26:52 字數 1567 閱讀 4967

目錄

第2章 k-近鄰演算法

第3章 決策樹

第4章 基於概率論的分類方法:樸素貝葉斯

第5章 logistic回歸

第7章 利用adaboost元演算法提高分類效能

第8章 **數值型資料:回歸

1.python console匯入knn.py檔案

>>>import knn
1.reload的使用方法

>>>from imp import reload

>>>reload(...)

2.p45程式清單3-6

firststr = mytree.keys()[0]
更正為

firstsides = list(mytree.keys())

firststr = firstsides[0]

是因為python3改變了dict.keys返回的是dict-keys物件,支援iterable,但不支援indexable。

1.numpy庫的呼叫方法

from numpy import *

import numpy

兩種語句的作用都是引入numpy庫中的所有函式、物件、變數,但第一種可直接呼叫模組,如:random(),第二種的呼叫方式為:numpy.random(),通常應使用第二種語句呼叫numpy,防止與標準庫中的函式名衝突,造成混淆。

2.p65 切分文字

>>>string.split()
string代表字串名。

3.去除切分後產生的空字串

>>>[tok for tok in listoftokens if len(tok) > 0]
4.將字串全部轉換成小寫

>>>[tok.lower() for tok in listoftokens if len(tok) > 0]
5.隨機選擇資料的一部分作為訓練集,而剩餘部分作為測試集的過程稱為留存交叉驗證。

1.p82 **執行後出現錯誤 'range' object doesn't support item deletion

原因:python3  range返回的是range物件,不返回陣列物件

解決方法:在range(m)前加上list,改為list(range(m))。

1.p120 無窮的表示方法

>>>float("inf")    #正無窮

>>>float("-inf") #負無窮

①使用inf做簡單的加法、乘法運算仍然會得到inf。

②但0與inf相乘時,會得到not a number(nan)。

③除了inf之外的其他數字除以inf時,會得到0。

④inf與inf相除,會得到not a number(nan)。

1.numpy.linalg模組包含線性代數的函式。

2.numpy.eye()函式生成對角矩陣。

《機器學習實戰》學習筆記

很久沒寫過部落格了,一重開就給自己挖了這麼乙個大坑 最近一段時間看了 機器學習實戰 這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣 京東 亞馬遜等 這裡不多說。不過有一點,感覺這本書有個很好的地方是給出了各個演算法的python實現 和講解,要求不高的話可以拿來用了 懶 在這...

《機器學習實戰》學習筆記

通過對輸入資料inx和資料集dataset座標距離的計算返回結果 資料集包括group 座標 和labels 分類 計算inx與group點與點的距離 對距離遞增排序 選取排序後的前k個值對應的label 根據label出現的頻率對inx進行分類 def classify0 inx,dataset,...

機器學習實戰筆記

在 機器學習實戰 的決策樹的儲存這方面內容學習過程中,進行 除錯時遇到以下兩個錯誤 1 typeerror write argument must be str,not bytes 2 unicodedecodeerror gbk codec can t decode byte 0x80 in po...