機器學習 決策樹模型

2021-08-28 09:36:05 字數 593 閱讀 2781

決策樹通過生成決策規則來解決分類和回歸問題。整個模型非常容易理解,是所謂的白盒模型。

比如通過年齡、職業、年齡、房產來評估信用值,文末有sklearn實現**

類似於流程圖的樹結構,由乙個根節點,一組內部節點和一組葉節點組成。每個內部節點(包括根節點)表示在乙個屬性上的測試,每個分支表示乙個測試輸出,每個葉節點表示乙個類,有時不同的葉節點可以表示相同的類。

決策樹最大的缺點在於模型的最後一步演算法過於簡單:對於分類問題,只考慮葉子節點裡哪個類別佔比最大;而對於回歸問題,則計算葉子節點內資料的平均值。

這導致它在單獨使用時,**效果不理想。因此在實際中,決策樹常常被用來做特徵提取,與其他模型聯結起來使用。

id3(iterative dichotomister 迭代的二分器)

cart(classification and regression trees)

id3、c4.5和cart都採用貪心(即非回溯的)方法,其中決策樹以自頂向下遞迴的分治方式構造。大部分決策樹歸納演算法都沿用這種自頂向下方法,從訓練元組集和它們相關聯

機器學習 決策樹

一 基本概念 決策樹 decision tree 是一種基本的分類與回歸方法。決策樹模型呈樹形結構,在分類問題中,表示屬於特徵對例項進行分類的過程,它可以認為是if then規則的集合,也可以認為是電議在特徵空間與類空空上的條件概率分布,其主要優點是模型具有可讀性,分類速度快。決策樹的學習通常包括3...

機器學習 決策樹

我覺得決策樹是機器學習所有演算法中最可愛的了 沒有那麼多複雜的數學公式哈哈 下圖是一棵決策樹,用來判斷西瓜是好瓜還是壞瓜 決策過程中提出的每個判定問題都是都對某個屬性的測試,每個測試結果要麼推導出最終結論,要麼匯出進一步判斷的問題,在上次決策結果限定的範圍內做進一步判斷。從上圖可以看出,葉節點對應決...

機器學習 決策樹

一 演算法簡介 決策樹一般都是自上而下來生成的,每個決策後事件 即自然狀態 都可能引出兩個或多個事件,導致結果的不同,把這種結構分支畫成形狀很像一棵樹的枝幹,故稱為決策樹。決策樹能夠讀取資料集合,並且決策樹很多任務都是為了資料中所蘊含的知識資訊,因此決策樹可以使用不熟悉的資料集合,並從中提取一系列規...