ID3演算法的Python實現

2021-08-14 02:53:11 字數 619 閱讀 4809

本篇文章的**是在《id3演算法的原理及實現(python)》的基礎上進行新增和修改實現的,感謝原作者。

1、新增的功能

1、拆分檔案,使得函式的呼叫更加清晰

2、增加了gui,增加了資料的讀取和**功能

3、增加了乙個遞迴終止條件

2、gui介面展示

以檔案中給出的資料集為例,填充如下:

注:這裡類標籤的位置從0開始

3、檔案的說明

4、採用資料集的說明

採用的資料集是蘑菇資料集,訓練資料集有7853條,測試資料集有271條

根據蘑菇的屬性判斷其是否可以食用,第乙個是類標籤,e代表可食用,p代表有毒,根據剩餘的22個資料集來判別乙個蘑菇是否有毒。

5、**鏈結

用python實現ID3演算法

coding utf 8 from math import log import operator 資料樣本 編號 用腮呼吸 是否有腳蹼 屬於魚類 1 是 是 是 2 是 否 是 3 是 否 否 4 否 是 否 5 否 是 否 def createdataset dataset 1,1,yes 1,...

ID3演算法Java實現

1.1 資訊熵 熵是無序性 或不確定性 的度量指標。假如事件a 的全概率劃分是 a1,a2,an 每部分發生的概率是 p1,p2,pn 那資訊熵定義為 通常以2 為底數,所以資訊熵的單位是 bit。1.2 決策樹 決策樹是以例項為基礎的歸納學習演算法。它從一組無次序 無規則的元組中推理出決策樹表示形...

java實現ID3演算法

id3是經典的分類演算法,要理解id3演算法,需要先了解一些基本的資訊理論概念,包括資訊量,熵,後驗熵,條件熵。id3演算法的核心思想是選擇互資訊量最大的屬性作為分割節點,這樣做可以保證所建立的決策樹高度最小。樹結構 c4.5決策樹資料結構 author zhenhua.chen descripti...