1.屬性選擇的先後順序
1.id3演算法實現
id3演算法的詳細實現步驟如下:
import pandas as pd
from sklearn.tree import decisiontreeclassifier,export_graphviz
from sklearn.metrics import classification_report
import graphviz
data = pd.read_csv('titanic_data.csv')
data.drop('passengeid',axis=1,inplace=true) #刪除passengeid這一列
data.loc[data['***'] == 'male','***'] =1 #用數值1來代替male,用0來代替female
data.loc[data['***'] == 'female','***'] =0
data.fillna(data['age'].mean(),inplace=true) #用均值來填充缺失值
dtc = decisiontreeclassifier(max_depth=5,random_state=8) #構建決策樹模型
dtc.fit(data.iloc[:,1:],data['survived']) #模型訓練
pre = dtc.predict(data.iloc[:,1:]) #模型**
pre == data['survived'] #比較模型**值與樣本實際值是否一致
classification_report(data['survived'],pre) #模型分類報告
dot_data = export_graphviz(dtc,feature_names=['pclass','***','age'],class_names='survived')
graph = graphviz.source(dot_data)
graph
選擇題
操作題
機器學習(二) 決策樹
決策樹是用於分類的一種機器學習演算法。其最大的特點就是簡單,直觀.由於資料來自於之前的筆記。原例子的出處找不到,乾脆就手繪算了 xd。其中如果資料不是離散值,要先處理成離散值再進行決策樹的計算。圖1 用乙個例子來講吧。如上圖,現在是有14條資料都從調研中得到,其中是研究是否買電腦的資料,rid是列號...
機器學習二 決策樹學習
決策樹學習 從今天開始,堅持每天學習乙個機器學習的新知識,加油!決策樹學習是應用最廣的歸納推理演算法之一,是一種逼近離散值目標函式的方法,在這種方法中學習到的函式被表示為一顆決策樹。決策樹通過把例項從根結點排列到某個葉子結點來分類例項,葉子結點即為例項所屬的分類。樹上的每乙個結點指定了對例項的某個屬...
機器學習筆記二 決策樹
一顆決策樹包含乙個根結點,若干內部結點 對應乙個測試屬性 和若干葉結點 對應決策結果 決策流程採用分而治之的整體思想,根結點包含樣本全集,對各個特徵進行判斷,直至所有葉結點均對應一種類別的樣本。決策樹的關鍵在於劃分屬性的選擇,隨著劃分不斷進行,分支結點所包含樣本應盡可能屬於同一類別,即純度越來越高,...