常見的機器學習演算法(十)決策樹 隨機森林 極限樹

2021-10-06 12:19:35 字數 2187 閱讀 8527

直接呼叫sklearn的api:

from sklearn import tree                              #決策樹分類器#

module = tree.decisiontreeclassifier(criterion='gini')

module.fit(x, y)

module.score(x, y)

module.predict(test)

from sklearn.ensemble import randomforestclassifier  #隨機森林#

from sklearn.ensemble import randomforestregressor

module = randomforestclassifier()

module.fit(x, y)

module.predict(test)

整體**1:

from sklearn.datasets import load_iris

from sklearn.tree import decisiontreeclassifier

from sklearn.model_selection import cross_val_score # 交叉驗證函式

iris = load_iris()

dtc = decisiontreeclassifier()

dtc.fit(iris.data, iris.target)

# 使用決策樹分類器作為評估模型,iris.data鳶尾花資料作為特徵,iris.target鳶尾花分類標籤作為目標結果,設定cv為10,使用10折交叉驗證,得到最終的交叉驗證得分。

print(cross_val_score(dtc, iris.data, iris.target, cv=10))

print('-----------------------------')

print(dtc.predict(iris.data))#**出對應標籤

整體**2:

from sklearn.model_selection import cross_val_score #交叉驗證

from sklearn.datasets import make_blobs

from sklearn.tree import decisiontreeclassifier #決策樹

from sklearn.ensemble import randomforestclassifier #隨機森林

from sklearn.ensemble import extratreesclassifier #極限樹

#建立100個類,共10000個樣本,每個樣本10個特徵

x ,y = make_blobs(n_samples=10000, n_features=10, centers=100, random_state=0)

dtc = decisiontreeclassifier(random_state=0)

score_dtc = cross_val_score(dtc, x, y)

print('score_dtc均值: ', score_dtc.mean())

rfc = randomforestclassifier(n_estimators=10, random_state=0)

score_rfc = cross_val_score(rfc, x, y)

print('score_rfc均值: ', score_rfc.mean())

etc = extratreesclassifier(n_estimators=10, random_state=0)

score_etc = cross_val_score(etc, x, y)

print('score_etc均值: ', score_etc.mean())

效能對比: 極限樹 > 隨機森林 > 決策樹

機器學習 決策樹 隨機森林演算法

決策樹api from sklearn.tree import decisiontreeclassifier import pandas as pd 字典特徵抽取 from sklearn.feature extraction import dictvectorizer from sklearn.m...

機器學習演算法 決策樹

決策樹類似一中策略或者條件選擇,其中各個節點代表選擇條件,各個葉子結點代表可能達到的結果,決策樹 decision tree 是乙個樹結構 可以是二叉樹或非二叉樹 其每個非葉節點表示乙個特徵屬性上的測試,每個分支代表這個特徵屬性在某個值域上的輸出,而每個葉節點存放乙個類別。使用決策樹進行決策的過程就...

機器學習演算法 決策樹

決策樹的使用主要是用於分類。年齡收入 信用是否學生 是否買電腦年輕高 高是是中年 低中否否 老年中低否 是對於一些適合分類的資料中,考慮各種因素對結果的影響大小進行決策,一般是先選取區分度較高的因素。比如說,年齡大小這個因素在很大程度上影響我們的結果 是否買電腦。那麼,年齡因素將作為第乙個決策因素出...