機器學習筆記 監督學習之決策樹

2022-03-29 20:42:19 字數 502 閱讀 2529

0機器學習中分類和**演算法的評估:

1決策樹(判定樹)的概念

決策樹是乙個類似於流程圖的樹結構(可以是二叉樹或多叉樹):其中,每個內部結點表示在乙個屬性上的測試,每個分支代表乙個屬性輸出,而每個樹葉結點代表類或類分布。樹的最頂層是根結點。機器學習中分類方法中的乙個重要演算法。

2.熵(entropy)概念

資訊和抽象如何度量?2023年,夏農提出「資訊熵」的概念。

一條資訊的資訊量大小和它的不確定性有直接的關係,要搞清楚一件非常非常不確定的事情,或者是我們一無所知的事情,需要了解大量的資訊==>資訊量的度量就等於

3.決策樹的歸納演算法(id3)

3.1選擇屬性判斷結點

3.2資訊獲取量:gain(a)=info(d)-info_a(d)

基本步驟:

機器學習 監督學習之決策樹分類模型

a.一種樹形結構的分類器。b.通過順序詢問分類點的屬性決定分類點的最終類別。c.決策樹的構建通常根據特徵的資訊增益或其他指標。d.分類時,只需要按照決策樹中的結點依次進行判斷,即可得到樣本所屬類別。eg 信用卡償還能力分類決策樹 可通過sklearn.tree.decisiontreeclassif...

《機器學習》學習筆記之決策樹

決策樹,顧名思義,以樹的結構來進行 它的基本概念在章節開頭有詳細的介紹。構建樹的遞迴演算法中,有三個情形會導致遞迴返回。其中第二個 當前屬性 特徵 集為空,或是所有樣本在所有屬性上取值相同,無法劃分。其意思是 已經沒有特徵拿來作進一步劃分生成子節點,或者此結點中的樣本標記不一致,但是他們在剩餘待劃分...

機器學習之決策樹學習筆記

機器學習之決策樹學習筆記 什麼是決策樹?決策樹是根據資料特徵 屬性 進行不斷分類最終得到結論的一種機器學習方法。point1 資料特徵的選擇的依據是屬性的資訊增益 部分?point2 不斷分類表明決策樹是乙個遞迴過程 一 資訊熵與資訊增益 決策樹學習的關鍵是如何選擇最優劃分屬性,隨著劃分過程不斷進行...