GBDT的一些知識點

2021-10-01 07:32:56 字數 469 閱讀 1482

通過梯度提公升和梯度下降演算法的對比情況。可以發現,兩者都是在每一輪迭代中利用損失函式相對與模型的負梯度方向的資訊來對 當前模型進行更新,只不過在梯度下降中,模型是以引數化的形式表示。從而模型的更新等價與引數的更新,而在梯度提公升中,模型並不需要 進行引數化表示,而是直接定義在函式空間中,從而大大擴充套件了可以使用的模型種類。

**階段的計算速度快,樹與樹之間可以並行化計算。

在分布稠密的資料集上,泛化能力和表達能力都很好,這使得gbdt在kaggle的眾多競賽中,經常名列前茅。

採用決策樹作為弱分類器使得gbdt模型有著較好的可解釋性和魯棒性,能夠自動發現特徵間的高階關係,並且也不需要對資料進行特殊的預處理如歸一化等。

gbdt在高維稀疏的資料集上,表現不如支援向量機或者神經網路。

gbdt在處理文字分類特徵問題上,相對於其他模型的優勢不如它在處理數值特徵時明顯。

訓練過程需要序列化,只能在決策樹內部採取一些區域性並行的手段提高訓練速度。

一些知識點

字串拼接 1.a join b a為元素之間的分隔符,b為待分割的序列 可用於輸出時的資料處理,元素間有空格,末尾沒有 2 s s s str1,str2,str3 前半部分為字串,後半部分為索引。用於引入,s是物件 3.format str1,str2,str3 與f 括號裡為已有變數 關於for...

一些知識點

1.vector是在堆上還是棧上?在堆上.2.我們發現指標有一些 似是而非 的特徵 1 指標消亡了,並不表示它所指的記憶體會被自動釋放。比如函式中的指標是區域性變數,如果它指向了堆上,而自己出了函式後消亡了,但它所指向的記憶體還是存在的,導致了記憶體洩漏.2 記憶體被釋放了,並不表示指標會消亡或者成...

一些知識點

1 sln 解決方案檔案 csproj 專案檔案 cs 原始檔 解決方案包含多個專案,每個專案都是乙個程式。config 配置檔案 3 const int a 1 const 定義乙個量為常量,運算中用到當常量使用,不可以再重新賦值。4 型別轉換。1 隱式轉換。從值型別轉換成引用型別。從引用型別轉換...