自己救自己系列,不然要沒工作了,我太難了。
紅色加粗是我見了好多次,感覺經常會考得點。
感覺決策樹是很常考的內容,所以一定要注意!!
1) id3 的構造準則是資訊增益
2) c4.5的構造準則是資訊增益比
3) cart(classfication and regression tree, 分類與回歸樹)
分類問題的構造準則為基尼指數
回歸問題的構造準則為資訊增益比
公式要記,具體詳見:
2、3種演算法的區別,優缺點,應用場景。
區別和優缺點可以參考這篇講決策樹的知乎文章
3、決策樹處理連續值的方法;
4、決策樹如何後剪枝
附問題:欲剪枝,後剪枝,及其比較
更深一點的剪枝演算法:
補充乙個講決策樹的知乎文章
好像就這麼點?因為決策樹主要會和rf, gbdt,xgboost之類一起考,等複習到以後再有補充繼續更
1、機器學習相關準備知識
1.1 svm演算法面試問題彙總 (機器學習必考)
1.2 決策樹演算法面試問題彙總
1.3 邏輯回歸(lr)演算法面試問題彙總
1.4 knn演算法面試問題彙總
1.5 整合學習演算法面試問題彙總(含rf,adboost,gbdt )
3、程式設計相關準備知識(我用的c++)
3.1 set基本定義與使用
3.2 map基本定義與使用
3.3 vector陣列基本定義與使用
3.4 string基本定義與使用
3.5 stack基本定義與使用
決策樹問題彙總
1.簡述決策樹原理?決策樹是一種基本的分類與回歸方法。它可以認為是if then規則的集合,也可以認為是定義在特徵空間與類空間上的條件概率分布。決策樹是一種自上而下,對樣本資料進行樹形分類的過程,由節點和有向邊組成。節點分為內部節點和葉節點,每個內部節點表示乙個特徵或屬性,葉節點表示類別,邊代表劃分...
決策樹筆記彙總
網上關於決策樹的博文已經有很多了。我挑選了幾篇比較好理解的幾篇,作為以後查閱備忘。同時,決策樹剛開始學習時,概念比較多,建議博文結合西瓜書一起看,因為有些公式這樣寫不太理解,但是別的地方換一種寫法,就會容易理解很多。資訊熵 資訊增益 id3 資訊增益比 c4.5 參閱下面兩篇博文 基尼指數 cart...
決策樹演算法
決策樹是一種樹型結構,其中每個內部結點表示在乙個屬性上的測試,每個分支代表乙個測試輸出,每個葉結點代表一種類別。決策樹學習是以例項為基礎的歸納學習,採用的是自頂向下的遞迴方法,其基本思想是以資訊熵為度量構造一棵熵值下降最快的樹,到葉子結點處的熵值為零,此時每個葉節點中的例項都屬於同一類。決策樹學習演...