機器學習實戰 決策樹的構造

2021-09-25 12:45:09 字數 333 閱讀 6771

決策樹的步驟:(西瓜書)

1.生成節點node

2.if 所有樣本都是乙個類別,則node為該類別

3.if 當前屬性集合為空集,或者所有樣本在屬性集合中所有屬性的取值相同,無法劃分

4.剔除上面幾種情況之後,選擇最優劃分屬性進行劃分,記最優屬性為a*

(如何選擇?有幾個度量標準:熵;資訊增益;增益率;基尾指數)

5.for ai in a

node以下生成對應分支,

if 對應ai的取值集合為空,則分支節點為葉節點;

else 以除了屬性a以外的屬性進行再次劃分。

6.最終得到以node為根節點的決策樹。

機器學習實戰 決策樹

決策樹 2 python語言在函式中傳遞的是列表的引用,在函式內部對列表物件的修改,將會影響該列表物件的整個生存週期。為了消除這個不良影響,我們需要在函式的開始宣告乙個新列表物件。在本節中,指的是在劃分資料集函式中,傳遞的引數dataset列表的引用,為了不影響dataset我們重新宣告了乙個ret...

機器學習實戰決策樹

這幾天一直在學習機器學習實戰python 實現,在程式清單的3 6 獲取及誒單數程式,書上的程式是這樣的 def getnumleafs mytree numleafs 0.0 firststr list dict.keys mytree 0 seconddict mytree firststr p...

機器學習實戰 決策樹

class sklearn.tree.decisiontreeclassifier criterion gini splitter best max depth none,min samples split 2,min samples leaf 1,min weight fraction leaf ...