xgboost簡單介紹 XGBOOST模型介紹

2021-10-17 02:18:26 字數 869 閱讀 5853

前言

這是機器學習系列的第三篇文章,對於住房租金**比賽的總結這將是最後一篇文章了,

比賽持續乙個月自己的總結竟然也用了乙個月,

牽強一點來說機器學習也將會是乙個漫長

的道路,

後續機器學習的文章大多數以知識科普為主,

畢竟自己在機器學習這個領域是個

渣渣,自己學到的新知識點會分享給大家的。

前面的文章談了談這次比賽非技術方面的收穫,對資料集的初步了解和特徵工程的處理,

今天主要介紹這次使用的模型

--xgboost

xgboost

模型介紹

關於xgboost

的原理網路上的資源很少,大多數還停留在應用層面,自己也是僅僅學習了

簡單介紹:

xgboost

是乙個監督模型,

xgboost

對應的模型本質是一堆

cart

樹。用一堆樹做**,

就是將每棵樹的**值加到一起作為最終的**值。

下圖就是

cart

樹和一堆

cart

樹的示例,用來判斷乙個人是否會喜歡計算機遊戲:

第二張圖明了如何用一堆

cart

樹做**,就是簡單將各個樹的**分數相加。

引數介紹:

官方引數介紹看這裡:

比較重要的引數介紹:

reg:linear

–線性回歸。

reg:logistic

–邏輯回歸。

binary:logistic

–二分類的

邏輯回歸問題,輸出為概率。

binary:logitraw

–二分類的邏輯回歸問題,輸出的結果

xgboost簡單介紹 xgboost介紹

xgboost是華盛頓大學博士陳天奇創造的乙個梯度提公升 gradient boosting 的開源框架。至今可以算是各種資料比賽中的大殺器,被大家廣泛地運用。接下來,就簡單介紹一下xgboost和普通的gbdt相比,有什麼不同。何為gradient boosting,gbdt請看我上篇文章 1.梯...

Xgboost引數介紹

xgboost是boosting演算法的一種,是多個表現一般的學習器結合成的強分類器。在目標函式上,增加了結構風險,也就是正則化項,l1和l2正則,l1是樹葉子節點個數,l2是葉子節點打分的平方 在目標函式的優化上,採用二階泰勒展開,使用了二階導數,然後令偏導等於0,於是就可以計算出每乙個葉子節點的...

mysql的簡單介紹 mysql的簡單介紹

mysql的簡單介紹 資料庫的內部鏈結 1 連線管理器 使用者或應用程式連線 2 分析器 3 快取區4 優化器 優化器執行的結果交由儲存引擎,再轉向物理層 表空間 myisam每個表有三個檔案 frm 表結構 myd 表資料 myi 表索引 innodb 所有表空間再乙個檔案 資料庫失敗的原因 1 ...