決策樹2 ID3演算法

2021-10-06 22:27:48 字數 761 閱讀 4542

決策樹-1基本概念中已經提到了id3演算法,這篇部落格再梳理一遍,演算法描述部分搬運了統計學習方法的內容,更詳細內容可以參考這本書。

這裡的描述可作為程式設計實現時的指導,樹的建立過程是遞迴實現。

123

4567

891011

1213

1415

1617

1819

2021

2223

defid3tree

(d, a,ε ):

if d 的例項屬於同類別 k || 特徵集 a 特徵空:

1. 決策樹 t為單結點樹

2. 標記類別 k (數量最多的類別)

return t

else:

1. 計算所有特徵相對於 d 的資訊增益

2. 找到資訊增益最大特徵 amax

if amax 小於 閾值 ε:

1. 決策樹 t為單結點樹

2. 標記類別 k (數量最多的類別)

return t

else:

依照特徵 amax 的每乙個取值 ai,劃分資料集di, 並且標記di類別,構建子節點

# 遞迴

對每個結點di,以di為訓練集, a-amax為特徵集,遞迴呼叫 id3tree()

return 由結點和子結點構成的樹

機器學習筆記2 ID3決策樹學習

個人決策樹學習兩個難點 1.如何度量樣本集合不確定度 純度 以安排節點。2.如何實現資訊的儲存和有效利用。決策樹學習 id3 的重點其實是分類的思路,但是很多部落格都寫的很詳細了便不再叨述,大體就是通過統籌分類建立乙個多叉樹,通過多個標籤屬性查詢,來實現新樣本資料的分類工作。而解決最開始說的兩個問題...

決策樹 ID3演算法

id3演算法通過計算每個屬性的資訊增益,認為資訊增益越大屬性越優,每次劃分選取資訊增益最大的屬性為劃分標準,重複這個過程,直到構成一棵決策樹。資訊熵是描述事件給我們的驚訝程度,如果所有事件的概率均等,那熵值大,驚訝程度低。如果有一事件的概率極高而其他極低,熵值便低,驚訝程度大。其計算公式如下 資訊增...

決策樹 ID3演算法

一 決策樹基本概念 在機器學習中,決策樹是乙個 模型,它代表的是物件屬性與物件值之間的一種對映關係。本質上決策樹是通 過一系列規則對資料進行分類的過程。下圖為經典決策樹例項。如圖所示,例項是由 屬性 值 對表示的 例項是用一系列固定的屬性和他們的值構成。目標函式具有離散的輸出值 上圖給每個例項賦予乙...