機器學習之筆記 決策樹

2021-08-20 23:05:32 字數 522 閱讀 6961

決策樹

概念:

決策樹(decision tree)是在已知各種情況發生概率的基礎上,通過構成決策樹來求取淨現值的期望值大於等於零的概率,評價專案風險,判斷其可行性的決策分析方法,是直觀運用概率分析的一種**法。由於這種決策分支畫成圖形很像一棵樹的枝幹,故稱決策樹。

一般流程:

(1)收集資料 :可以使用任何方法

(2)準備輸入資料 :樹構造演算法只適用於標稱型資料,因此數值型資料必須離散化

(3)分析輸入資料 :可以使用任何方法,構造樹完成後,我們應該檢查圖形是否符合預期

(4)訓練演算法 :構造樹的資料結構

(5)測試演算法 :使用經驗樹計算錯誤率

(6)使用演算法 :此步驟可以使用於任何監督學習演算法,而使用決策樹可以更好地理解資料的內在含義

優缺點:

(1)優點: 計算複雜=度不高,輸出接軌易於理解,對中間之的卻是不敏感,可以處理不相關特徵資料.

(2)缺點:可能會產生過度匹配問題

(3)適用資料型別: 數值型和標稱型

《機器學習》學習筆記之決策樹

決策樹,顧名思義,以樹的結構來進行 它的基本概念在章節開頭有詳細的介紹。構建樹的遞迴演算法中,有三個情形會導致遞迴返回。其中第二個 當前屬性 特徵 集為空,或是所有樣本在所有屬性上取值相同,無法劃分。其意思是 已經沒有特徵拿來作進一步劃分生成子節點,或者此結點中的樣本標記不一致,但是他們在剩餘待劃分...

機器學習之決策樹學習筆記

機器學習之決策樹學習筆記 什麼是決策樹?決策樹是根據資料特徵 屬性 進行不斷分類最終得到結論的一種機器學習方法。point1 資料特徵的選擇的依據是屬性的資訊增益 部分?point2 不斷分類表明決策樹是乙個遞迴過程 一 資訊熵與資訊增益 決策樹學習的關鍵是如何選擇最優劃分屬性,隨著劃分過程不斷進行...

機器學習之決策樹

在這裡,我想以更直觀的方式幫助各位理解 掌握並且運用 注意 是運用 決策樹,從而為機器學習作鋪墊。ps 但還是希望大家稍微知道決策樹大概是什麼樣子。1.根結點 root node 沒有入邊,但有零條或多條出邊 2.內部結點 internal node 恰有一條入邊和 兩條或多條出邊 3.葉結點 le...