機器學習 監督學習之決策樹分類模型

2021-10-24 05:02:02 字數 1150 閱讀 8876

a.一種樹形結構的分類器。

b.通過順序詢問分類點的屬性決定分類點的最終類別

c.決策樹的構建通常根據特徵的資訊增益或其他指標

d.分類時,只需要按照決策樹中的結點依次進行判斷,即可得到樣本所屬類別。

eg:信用卡償還能力分類決策樹

可通過sklearn.tree.decisiontreeclassifier建立乙個決策樹用於分類,主要引數:

1.criterion:用於選擇屬性的準則。(「gini」代表基尼係數,「entropy」代表資訊增益)

2.max_features:在決策樹結點進行**時,從多少個特徵中選擇最優特徵。(可設定固定數目、百分比或其他標準,預設為使用所有特徵個數)

eg:

from sklearn.datasets import load_iris

from sklearn.tree import decisiontreeclassifier

from sklearn.model_selection import cross_val_score # 計算交叉驗證值的函式cross_val_score

clf = decisiontreeclassifier(

)# 建立一顆基於基尼係數的決策樹並賦值給clf

iris = load_iris(

)# 鳶尾花資料賦值

# 將決策樹分類器作為待評估模型,iris.data鳶尾花資料作為特徵,iris.target鳶尾花分類標籤作為目標結果,通過設定cv為10,使用10折交叉驗證,即可得到最終的交叉驗證得分

print

(cross_val_score(clf, iris.data, iris.target, cv=10)

)

輸出:

a.決策樹本質上是尋找一種對特徵空間上的劃分,旨在構建乙個訓練資料擬合的好,並且複雜度小的決策樹。

b.實際使用中需根據實際資料情況調整decisiontreeclassifier類中的傳入的引數,比如選擇合適的criterion,設定隨機變數等。

機器學習筆記 監督學習之決策樹

0機器學習中分類和 演算法的評估 1決策樹 判定樹 的概念 決策樹是乙個類似於流程圖的樹結構 可以是二叉樹或多叉樹 其中,每個內部結點表示在乙個屬性上的測試,每個分支代表乙個屬性輸出,而每個樹葉結點代表類或類分布。樹的最頂層是根結點。機器學習中分類方法中的乙個重要演算法。2.熵 entropy 概念...

機器學習之決策樹分類器

決策樹,當下比較流行的有三種分類器,c4.5,id3,cart,不過大同小異,主要的區別就是選擇的目標函式不同,id3使用的是資訊增益,c4.5使用資訊增益率,cart使用的是gini係數。具體的原理就不說了,去翻翻別的博主吧,下面給出本人測試的小demo,幫助各位學者更快入手。coding utf...

機器學習筆記 監督學習 無監督學習分類筆記

無監督學習 給出一資料組,並已知曉這組資料的對應關係,然後給出一組新的資料,嘗試對其進行 和分析,這裡注意,提前給出的資料組 data set 是已知內部的資料的對應關係,後面給出的新的資料,是要依據對之前資料的學習後,給出新的資料對應的 值。而對於 的結果的不同,又將監督學習分為分類 classf...