決策樹,當下比較流行的有三種分類器,
c4.5,
id3,
cart,
不過大同小異,主要的區別就是選擇的目標函式不同,id3使用的是資訊增益,c4.5使用資訊增益率,cart使用的是gini係數。
,具體的原理就不說了,去翻翻別的博主吧,下面給出本人測試的小demo,幫助各位學者更快入手。
# -*- coding:utf-8 -*-
from sklearn.datasets import load_iris
from sklearn import preprocessing
from sklearn.model_selection import train_test_split
from sklearn.tree import decisiontreeclassifier
iris=load_iris()
x=iris.data #特徵資料
y=iris.target#標籤資料
#資料劃分
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3,random_state=1)
#資料標準化
scaler=preprocessing.standardscaler().fit(x_train)
x1_train=scaler.transform(x_train)
x1_test=scaler.transform(x_test)
#模型訓練
clf=decisiontreeclassifier(criterion='gini')
clf.fit(x1_train,y_train)
print(clf.predict(x1_test))
print(clf.score(x1_test,y_test))
decisiontreeclassifier(criterion='entropy', min_samples_leaf=3)函式為建立乙個決策樹模型,其函式的引數含義如下所示:
機器學習分類器 決策樹
一 決策樹 經常使用決策樹來處理分類問題,決策樹也是最經常使用的資料探勘演算法,不需要了解機器學習的知識,就能搞明白決策樹是如何工作的。knn演算法可以完成很多分類任務,但它最大的缺點就是無法給出資料的內在含義,決策樹的主要優勢在於資料形式非常容易理解 決策樹能夠讀取資料集合,其乙個重要任務是為了資...
機器學習之決策樹
在這裡,我想以更直觀的方式幫助各位理解 掌握並且運用 注意 是運用 決策樹,從而為機器學習作鋪墊。ps 但還是希望大家稍微知道決策樹大概是什麼樣子。1.根結點 root node 沒有入邊,但有零條或多條出邊 2.內部結點 internal node 恰有一條入邊和 兩條或多條出邊 3.葉結點 le...
機器學習之決策樹
決策樹是很常見的機器學習分類演算法,竟然叫決策樹,那麼它的模型其實就像樹一樣。通過對樣本集的學習,挖掘出有用的規則。對於程式設計師來說或許以條件語句來看就更好理解了,決策樹可以看成是多個if then條件語句的集合。這種模型等同於我們寫的條件語句,所以它的 分類速度是很快的。來個例子了解下決策樹分類...