機器學習之隨機森林(一)

2021-09-26 06:51:35 字數 2215 閱讀 1305

走進森林,參天大樹一棵棵相繼出現

隨機森林是基於決策樹的整合學習模型,如果將一顆決策樹比作乙個決策者,那麼隨機森林就是一群決策者共同決定一件事情,所以相比於決策樹等單個學習器的模型,隨機森立的準確度和泛化能力往往更好和更高。

隨機森林是多個學習器平行計算的演算法模型,通過一定的結合策略,將這些弱學習器有機組合起來,形成乙個強的學習器。

優點

隨機森林的隨機體現在樣本隨機和特徵隨機。

如果可以計算出每個特徵的重要性,即 importance(k) for k = 1, 2, … ,d。那就能將不重要的特徵捨棄,達到降維的效果

置換檢驗

function randomforest(d,t)

for t=1,

2,..

.,t //可以並行執行

②使用特徵隨機取樣後的資料集,訓練弱學習器gt

return g=uniform(gt) 將多個弱學習器結合起來

分類演算法回歸演算法

'''# 效果如下

0.9460941802827244

predict 1 2 3 4 5 6 7

label

1 59793 3614 0 0 20 4 140

2 2744 81808 165 1 123 106 32

3 3 217 10268 48 6 225 0

4 0 1 101 692 0 19 0

5 43 638 43 0 2137 9 0

6 9 197 427 24 5 4517 0

7 393 38 0 0 1 0 5693

0.9460941802827244

'''

機器學習之隨機森林(一)

如果大家想學人工智慧的話,那麼就一定不能夠忽視有關機器學習的內容。這時候就會有人問,什麼是機器學習?所謂機器學習就是一門多領域交叉學科,涉及概率論 統計學 逼近論等多門學科。機器學習是專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能的一門...

機器學習之隨機森林(一)

如果大家想學人工智慧的話,那麼就一定不能夠忽視有關機器學習的內容。這時候就會有人問,什麼是機器學習?所謂機器學習就是一門多領域交叉學科,涉及概率論 統計學 逼近論等多門學科。機器學習是專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能的一門...

機器學習 隨機森林

opencv包含隨機森林 random forest 類,隨機森林可以通過收集很多樹的子節點對各個類別的投票,然後選擇獲得最多投票的類別作為判斷結果。通過計算 森林 的所有子節點上的值的平均值來解決回歸問題。隨機森林包含隨機選擇的一些決策樹。隨機森林建立時的基本子系統也是決策樹,在建立決策樹時會一直...