第四章:問題1、程式清單4-5執行錯誤:'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence
問題定位:wordlist = textpares(open('email/ham/%d.txt'%i , encoding = 'gbk').read())
原因:是給定的樣本存在不能解碼的字元,
解決辦法:開啟email\ham\23.txt,找到scifinance?,把?替換成空格即可。
問題2、python3編譯錯誤:'range' object doesn't support item deletion
問題定位:del(dataindex[randindex])
原因:python2中range返回的是列表物件;python3中range返回的是range物件。而del函式不能對range物件進行操作
解決辦法:trainingset = list(range(50)) #強制轉換為list型別
機器學習實戰(Python3版)
水平有限,若有錯誤還請不吝賜教!最近在學機器學習,因為python2跟python3的差距,所以,我選擇直接學習python3來完成對機器學習實戰的內容,此類部落格會持續更新 等我完成本書內容,會慢慢在github上更新 接觸到第乙個演算法為k 近鄰演算法,其偽 如下 1.計算已知類別資料集中的點與...
機器學習實戰筆記一 Python3
程式清單2 1 k近鄰演算法 本筆記將主要注意力放在理解 上,所以大家看 中的注釋即可 個人程式注釋 python3 部分 改造 針對iteritems只支援python2的情況 from numpy import import operator 運算子模組 def createdataset gr...
Python3《機器學習實戰》02 決策樹
執行平台 windows python版本 python3 ide anaconda3 決策樹 decision tree 的乙個重要任務就是為了理解資料中所蘊含的知識資訊,因此決策樹可以使用不熟悉的資料集合,並從中提取出一系列規則,這些機器根據資料集建立規則的過程,就是機器學習過程。決策樹是一種基...