機器學習演算法之決策樹

1 演算法流程

一般的，一棵決策樹包含乙個根節點、若干內部節點和若干個葉節點；葉節點對應於決策結果，其他每個結點則對應於乙個屬性測試；每個結點包含的樣本集合根據屬性測試的結果被劃分到子結點中；根結點包含樣本全集.從根結點到每個葉結點的路徑對應了乙個判定測試序列.決策樹學習的目的是為了產生一棵泛化能力強，即處理未見示例能力強的決策樹，其基本流程遵循簡單且直觀的"分而治之" (divide-and-conquer)策略，基本流程如下圖所示。

在決策樹基本演算法中，有三種情形會導致遞迴返回: (1)當前結點包含的樣本全屬於同一類別，無需劃分; (2)當前屬性集為空，或是所有樣本在所有屬性上取值相同，無法劃分;(3)當前結點包含的樣本集合為空，不能劃分。

2 劃分選擇

由演算法流程可看出決策樹學習的關鍵是第8行，即如何選擇最優劃分屬性一般而言，隨著劃分過程不斷進行，我們希望決策樹的分支結點所包含的樣本盡可能屬於同一類別，即結點的"純度" (purity)越來越高。

2.1 資訊增益

2.2 增益率

2.3 基尼指數

機器學習演算法之決策樹

機器學習之決策樹演算法

機器學習演算法決策樹

機器學習演算法決策樹

機器學習演算法之決策樹

機器學習之決策樹演算法

機器學習演算法 決策樹

機器學習演算法 決策樹

相關推薦

機器學習演算法決策樹

機器學習演算法決策樹