sklearn機器學習 隨機森林

2021-10-07 08:39:50 字數 2201 閱讀 4513

多個模型整合成為的模型叫做整合評估器(ensemble estimator),組成整合評估器的每個模型都叫做基評估器(base estimator)。通常來說,有三類整合演算法:裝袋法(bagging),提公升法(boosting)和stacking

類類的功能

ensemble.adaboostclassifier

adaboost分類

ensemble.adaboostregressor

adaboost回歸

ensemble.baggingclassifier

裝袋分類器

ensemble.baggingregressor

裝袋回歸器

ensemble.extratreesclassifier

extra-trees分類(超樹,極端隨機樹)

ensemble.extratreesregressor

extra-trees回歸

ensemble.gradientboostingclassifier

梯度提公升分類

ensemble.gradientboostingregressor

梯度提公升回歸

ensemble.isolationforest

隔離森林

ensemble.randomforestclassifier

隨機森林分類

ensemble.randomforestregressor

隨機森林回歸

ensemble.randomtreesembedding

完全隨機樹的整合

ensemble.votingclassifier

用於不合適估算器的軟投票/多數規則分類器

class

sklearn

.ensemble.randomforestclassifier (n_estimators=』10』, criterion=』gini』, max_depth=

none

,min_samples_split=

2, min_samples_leaf=

1, min_weight_fraction_leaf=

0.0, max_features=』auto』,

max_leaf_nodes=

none

, min_impurity_decrease=

0.0, min_impurity_split=

none

, bootstrap=

true

, oob_score=

false

,n_jobs=

none

, random_state=

none

, verbose=

0, warm_start=

false

, class_weight=

none

)

隨機森林是非常具有代表性的bagging整合演算法,它的所有基評估器都是決策樹,分類樹組成的森林就叫做隨機森 林分類器,回歸樹所整合的森林就叫做隨機森林回歸器。這一節主要講解randomforestclassifier,隨機森林分類 器

引數含義

n_estimators

這是森林中樹木的數量,即基評估器的數量,n_estimators越大,模型的效果往往越好

criterion

不純度的衡量指標,有基尼係數和資訊熵兩種選擇

max_depth

樹的最大深度,超過最大深度的樹枝都會被剪掉

min_samples_leaf

乙個節點在分枝後的每個子節點都必須包含至少min_samples_leaf個訓練樣 本,否則分枝就不會發生

min_samples_split

乙個節點必須要包含至少min_samples_split個訓練樣本,這個節點才允許被分 枝,否則分枝就不會發生

max_features

限制分枝時考慮的特徵個數,超過限制個數的特徵都會被捨棄, 預設值為總特徵個數開平方取整

min_impurity_decrease

限制資訊增益的大小,資訊增益小於設定數值的分枝不會發生

機器學習 運用sklearn庫實現隨機森林分類

通過呼叫sklearn庫快速實現隨機森林 決策樹 極端隨機樹等分類演算法 方便大家學習以及自己以後使用 coding utf 8 created on mon sep 21 20 08 53 2020 author dell import math from sklearn.ensemble imp...

機器學習 隨機森林

opencv包含隨機森林 random forest 類,隨機森林可以通過收集很多樹的子節點對各個類別的投票,然後選擇獲得最多投票的類別作為判斷結果。通過計算 森林 的所有子節點上的值的平均值來解決回歸問題。隨機森林包含隨機選擇的一些決策樹。隨機森林建立時的基本子系統也是決策樹,在建立決策樹時會一直...

機器學習 隨機森林

以下內容均為個人理解,如有錯誤,歡迎指出 如何生成隨機森林基學習器的訓練資料集 隨機 的含義 bagging整合學習的評測方法 隨機森林的引數 以下內容摘自周志華老師的 機器學習 隨機森林是bagging的乙個擴充套件變體,它在以決策樹為基學習器構建的bagging整合的基礎上,進一步在決策樹的訓練...