#匯入sklearn的內嵌鳶尾花資料集
from sklearn.datasets import load_iris
#匯入決策樹分類器,同時匯入計算交叉驗證值的函式cross_val-score
from sklearn.tree import decisiontreeclassifier
from sklearn.model_selection import cross_val_score
#使用預設引數,建立一顆基於基尼係數的決策樹,並將該決策樹分類器賦值給變數clf
clf = decisiontreeclassifier(
)#將鳶尾花資料賦值給變數iris
iris = load_iris(
)# 這裡我們將決策樹分類器做為待評估的模型,iris.data鳶尾花資料做為特徵,
# iris.target鳶尾花分類標籤做為目標結果,通過設定cv為10,使用10折交叉驗
# 證。得到最終的交叉驗證得分。
array =cross_val_score(clf, iris.data, iris.target, cv =10)
print
(array)
#得到最終的交叉驗證得分
分類演算法 決策樹演算法
決策樹是一種對例項進行分類的樹形結構,也是一種基本的分類與回歸方法。決策樹由結點 node 和有向邊 directed edge 組成。結點又分為兩種型別 內部結點 internal node 和葉結點 leaf node 內部結點表示乙個特徵或屬性,葉結點表示乙個分類。如下圖所示為乙個決策樹模型 ...
決策樹(decision tree)分類演算法
2.1 決策樹 decision tree 分類演算法 決策樹是以例項為基礎的歸納學習演算法。它從一組無次序 無規則的元組中推理出決策樹表示形式的分類規則。它採用自頂向下的遞迴方式,在決策樹的內部結點進行屬性值 的比較,並根據不同的屬性值從該結點向下分支,葉結點是要學習劃分的類。從根到葉結點的一條路...
決策樹分類
一 分類的概念 分類是一種重要的資料分析形式,分類方法用於 資料物件的離散類別,而 則用於 資料物件的連續取值 資料分類是兩個階段的過程,包括學習階段和分類階段 學習階段 訓練階段 就是建立描述預先定義的資料類或概念集的分類器 而訓練集是有資料庫元祖和與他們相互關聯的類標號組成 類標號屬性是離散值和...