分類 決策樹演算法

2021-10-05 11:37:38 字數 634 閱讀 9983

#匯入sklearn的內嵌鳶尾花資料集

from sklearn.datasets import load_iris

#匯入決策樹分類器,同時匯入計算交叉驗證值的函式cross_val-score

from sklearn.tree import decisiontreeclassifier

from sklearn.model_selection import cross_val_score

#使用預設引數,建立一顆基於基尼係數的決策樹,並將該決策樹分類器賦值給變數clf

clf = decisiontreeclassifier(

)#將鳶尾花資料賦值給變數iris

iris = load_iris(

)# 這裡我們將決策樹分類器做為待評估的模型,iris.data鳶尾花資料做為特徵,

# iris.target鳶尾花分類標籤做為目標結果,通過設定cv為10,使用10折交叉驗

# 證。得到最終的交叉驗證得分。

array =cross_val_score(clf, iris.data, iris.target, cv =10)

print

(array)

#得到最終的交叉驗證得分

分類演算法 決策樹演算法

決策樹是一種對例項進行分類的樹形結構,也是一種基本的分類與回歸方法。決策樹由結點 node 和有向邊 directed edge 組成。結點又分為兩種型別 內部結點 internal node 和葉結點 leaf node 內部結點表示乙個特徵或屬性,葉結點表示乙個分類。如下圖所示為乙個決策樹模型 ...

決策樹(decision tree)分類演算法

2.1 決策樹 decision tree 分類演算法 決策樹是以例項為基礎的歸納學習演算法。它從一組無次序 無規則的元組中推理出決策樹表示形式的分類規則。它採用自頂向下的遞迴方式,在決策樹的內部結點進行屬性值 的比較,並根據不同的屬性值從該結點向下分支,葉結點是要學習劃分的類。從根到葉結點的一條路...

決策樹分類

一 分類的概念 分類是一種重要的資料分析形式,分類方法用於 資料物件的離散類別,而 則用於 資料物件的連續取值 資料分類是兩個階段的過程,包括學習階段和分類階段 學習階段 訓練階段 就是建立描述預先定義的資料類或概念集的分類器 而訓練集是有資料庫元祖和與他們相互關聯的類標號組成 類標號屬性是離散值和...