前言
這是機器學習系列的第三篇文章,對於住房租金**比賽的總結這將是最後一篇文章了,
比賽持續乙個月自己的總結竟然也用了乙個月,
牽強一點來說機器學習也將會是乙個漫長
的道路,
後續機器學習的文章大多數以知識科普為主,
畢竟自己在機器學習這個領域是個
渣渣,自己學到的新知識點會分享給大家的。
前面的文章談了談這次比賽非技術方面的收穫,對資料集的初步了解和特徵工程的處理,
今天主要介紹這次使用的模型
--xgboost
xgboost
模型介紹
關於xgboost
的原理網路上的資源很少,大多數還停留在應用層面,自己也是僅僅學習了
簡單介紹:
xgboost
是乙個監督模型,
xgboost
對應的模型本質是一堆
cart
樹。用一堆樹做**,
就是將每棵樹的**值加到一起作為最終的**值。
下圖就是
cart
樹和一堆
cart
樹的示例,用來判斷乙個人是否會喜歡計算機遊戲:
第二張圖明了如何用一堆
cart
樹做**,就是簡單將各個樹的**分數相加。
引數介紹:
官方引數介紹看這裡:
比較重要的引數介紹:
reg:linear
–線性回歸。
reg:logistic
–邏輯回歸。
binary:logistic
–二分類的
邏輯回歸問題,輸出為概率。
binary:logitraw
–二分類的邏輯回歸問題,輸出的結果
xgboost簡單介紹 xgboost介紹
xgboost是華盛頓大學博士陳天奇創造的乙個梯度提公升 gradient boosting 的開源框架。至今可以算是各種資料比賽中的大殺器,被大家廣泛地運用。接下來,就簡單介紹一下xgboost和普通的gbdt相比,有什麼不同。何為gradient boosting,gbdt請看我上篇文章 1.梯...
Xgboost引數介紹
xgboost是boosting演算法的一種,是多個表現一般的學習器結合成的強分類器。在目標函式上,增加了結構風險,也就是正則化項,l1和l2正則,l1是樹葉子節點個數,l2是葉子節點打分的平方 在目標函式的優化上,採用二階泰勒展開,使用了二階導數,然後令偏導等於0,於是就可以計算出每乙個葉子節點的...
mysql的簡單介紹 mysql的簡單介紹
mysql的簡單介紹 資料庫的內部鏈結 1 連線管理器 使用者或應用程式連線 2 分析器 3 快取區4 優化器 優化器執行的結果交由儲存引擎,再轉向物理層 表空間 myisam每個表有三個檔案 frm 表結構 myd 表資料 myi 表索引 innodb 所有表空間再乙個檔案 資料庫失敗的原因 1 ...