直接呼叫sklearn的api:
from sklearn import tree #決策樹分類器#
module = tree.decisiontreeclassifier(criterion='gini')
module.fit(x, y)
module.score(x, y)
module.predict(test)
from sklearn.ensemble import randomforestclassifier #隨機森林#
from sklearn.ensemble import randomforestregressor
module = randomforestclassifier()
module.fit(x, y)
module.predict(test)
整體**1:
from sklearn.datasets import load_iris
from sklearn.tree import decisiontreeclassifier
from sklearn.model_selection import cross_val_score # 交叉驗證函式
iris = load_iris()
dtc = decisiontreeclassifier()
dtc.fit(iris.data, iris.target)
# 使用決策樹分類器作為評估模型,iris.data鳶尾花資料作為特徵,iris.target鳶尾花分類標籤作為目標結果,設定cv為10,使用10折交叉驗證,得到最終的交叉驗證得分。
print(cross_val_score(dtc, iris.data, iris.target, cv=10))
print('-----------------------------')
print(dtc.predict(iris.data))#**出對應標籤
整體**2:
from sklearn.model_selection import cross_val_score #交叉驗證
from sklearn.datasets import make_blobs
from sklearn.tree import decisiontreeclassifier #決策樹
from sklearn.ensemble import randomforestclassifier #隨機森林
from sklearn.ensemble import extratreesclassifier #極限樹
#建立100個類,共10000個樣本,每個樣本10個特徵
x ,y = make_blobs(n_samples=10000, n_features=10, centers=100, random_state=0)
dtc = decisiontreeclassifier(random_state=0)
score_dtc = cross_val_score(dtc, x, y)
print('score_dtc均值: ', score_dtc.mean())
rfc = randomforestclassifier(n_estimators=10, random_state=0)
score_rfc = cross_val_score(rfc, x, y)
print('score_rfc均值: ', score_rfc.mean())
etc = extratreesclassifier(n_estimators=10, random_state=0)
score_etc = cross_val_score(etc, x, y)
print('score_etc均值: ', score_etc.mean())
效能對比: 極限樹 > 隨機森林 > 決策樹
機器學習 決策樹 隨機森林演算法
決策樹api from sklearn.tree import decisiontreeclassifier import pandas as pd 字典特徵抽取 from sklearn.feature extraction import dictvectorizer from sklearn.m...
機器學習演算法 決策樹
決策樹類似一中策略或者條件選擇,其中各個節點代表選擇條件,各個葉子結點代表可能達到的結果,決策樹 decision tree 是乙個樹結構 可以是二叉樹或非二叉樹 其每個非葉節點表示乙個特徵屬性上的測試,每個分支代表這個特徵屬性在某個值域上的輸出,而每個葉節點存放乙個類別。使用決策樹進行決策的過程就...
機器學習演算法 決策樹
決策樹的使用主要是用於分類。年齡收入 信用是否學生 是否買電腦年輕高 高是是中年 低中否否 老年中低否 是對於一些適合分類的資料中,考慮各種因素對結果的影響大小進行決策,一般是先選取區分度較高的因素。比如說,年齡大小這個因素在很大程度上影響我們的結果 是否買電腦。那麼,年齡因素將作為第乙個決策因素出...