本篇文章的**是在《id3演算法的原理及實現(python)》的基礎上進行新增和修改實現的,感謝原作者。
1、新增的功能
1、拆分檔案,使得函式的呼叫更加清晰2、gui介面展示2、增加了gui,增加了資料的讀取和**功能
3、增加了乙個遞迴終止條件
以檔案中給出的資料集為例,填充如下:
注:這裡類標籤的位置從0開始
3、檔案的說明
4、採用資料集的說明
採用的資料集是蘑菇資料集,訓練資料集有7853條,測試資料集有271條
根據蘑菇的屬性判斷其是否可以食用,第乙個是類標籤,e代表可食用,p代表有毒,根據剩餘的22個資料集來判別乙個蘑菇是否有毒。
5、**鏈結
用python實現ID3演算法
coding utf 8 from math import log import operator 資料樣本 編號 用腮呼吸 是否有腳蹼 屬於魚類 1 是 是 是 2 是 否 是 3 是 否 否 4 否 是 否 5 否 是 否 def createdataset dataset 1,1,yes 1,...
ID3演算法Java實現
1.1 資訊熵 熵是無序性 或不確定性 的度量指標。假如事件a 的全概率劃分是 a1,a2,an 每部分發生的概率是 p1,p2,pn 那資訊熵定義為 通常以2 為底數,所以資訊熵的單位是 bit。1.2 決策樹 決策樹是以例項為基礎的歸納學習演算法。它從一組無次序 無規則的元組中推理出決策樹表示形...
java實現ID3演算法
id3是經典的分類演算法,要理解id3演算法,需要先了解一些基本的資訊理論概念,包括資訊量,熵,後驗熵,條件熵。id3演算法的核心思想是選擇互資訊量最大的屬性作為分割節點,這樣做可以保證所建立的決策樹高度最小。樹結構 c4.5決策樹資料結構 author zhenhua.chen descripti...