# -*- coding: utf-8 -*-importnumpyasnp
importpandasaspd
fromsklearn.datasetsimportload_iris #匯入鳶尾花資料
fromsklearnimporttree #匯入機器學習決策樹包
fromsklearn.cross_validationimporttrain_test_split
defmain():
iris = load_iris()
printiris
printlen(iris["data"]) #資料長度
train_data,test_data,train_target,test_target = train_test_split(iris.data,iris.target,test_size=0.2,random_state=1)
#建模clf = tree.decisiontreeclassifier(criterion="entropy") #分類器決策樹 熵增益
clf.fit(train_data,train_target) #建立模型
y_pred = clf.predict(test_data) #測試集**
#驗證fromsklearnimportmetrics
printmetrics.accuracy_score(y_true = test_target,y_pred = y_pred) #真實值和**值 給出**精度
printmetrics.confusion_matrix(y_true=test_target,y_pred = y_pred) #混淆矩陣
withopen("./data/tree.dot","w")asfw: #將決策樹輸出值檔案
tree.export_graphviz(clf,out_file=fw)
if__name__ =="__main__":
main()
決策樹 初識
決策樹 顯然e a 越小,gain a 的值越大,說明選擇測試屬性a對於分類提供的資訊越大,選擇a之後對分類的分類提供的資訊越大,選擇a之後對分類的不確定成都越小.屬性a的k個不同的值對應樣本集s的k個子集或分支,通過遞迴呼叫上述的過程 不包括已經選擇的屬性 生成其他屬性作為節點和分支來生成整個決策...
機器學習 決策樹
一 基本概念 決策樹 decision tree 是一種基本的分類與回歸方法。決策樹模型呈樹形結構,在分類問題中,表示屬於特徵對例項進行分類的過程,它可以認為是if then規則的集合,也可以認為是電議在特徵空間與類空空上的條件概率分布,其主要優點是模型具有可讀性,分類速度快。決策樹的學習通常包括3...
機器學習 決策樹
我覺得決策樹是機器學習所有演算法中最可愛的了 沒有那麼多複雜的數學公式哈哈 下圖是一棵決策樹,用來判斷西瓜是好瓜還是壞瓜 決策過程中提出的每個判定問題都是都對某個屬性的測試,每個測試結果要麼推導出最終結論,要麼匯出進一步判斷的問題,在上次決策結果限定的範圍內做進一步判斷。從上圖可以看出,葉節點對應決...