金融風控5 模型融合

2021-10-09 20:33:25 字數 534 閱讀 8802

stacking vs. blending：stacking 將若干基學習器獲得的**結果，將**結果作為新的訓練集來訓練乙個學習器。假設有五個基學習器，將資料帶入五基學習器中得到**結果，再帶入模型六中進行訓練**。但是由於直接由五個基學習器獲得結果直接帶入模型六中，容易導致過擬合。所以在使用五個及模型進行**的時候，可以考慮使用k折驗證，防止過擬合。blending是將**的值作為新的特徵和原特徵合併，構成新的特徵值，用於**。為了防止過擬合，將資料分為兩部分d1、d2，使用d1的資料作為訓練集，d2資料作為測試集。**得到的資料作為新特徵使用d2的資料作為訓練集結合新特徵，**測試集結果。

平均（簡單平均、加權平均）

投票（簡單投票、加權投票）

stacking**（使用knn, random forest, ***** bayes，與用stacking融合三種模型的結果相比）

blending**

*stacking在比賽中比較好用，但是速度會很慢，實際環境中應用還是有一定的難度。

金融風控 Task5 模型融合

模型融合是比賽後期上分的重要手段，特別是多人組隊學習的比賽中，將不同隊友的模型進行融合，可能會收穫意想不到的效果哦，往往模型相差越大且模型表現都不錯的前提下，模型融合後結果會有大幅提公升，以下是模型融合的方式。平均 a.簡單平均法 b.加權平均法投票 a.簡單投票法 b.加權投票法綜合 a.排序...

金融風控模型

工作中暫時未涉及。此處為有幸得到的ppt。記錄學習內容，還有些心得，有錯誤請指出，感激什麼是欺詐風險網路借款人是否是本人網路借款人提交的資料是否真實什麼是信用風險網路借款人是否有還款的能力是否是沒有還款意願的老賴，多次違約貸款公司如何防範以上兩種風險針對乙個p2p借款的流程來說，借款...

金融風控學習筆記 5

stacking模型本質上是一種分層的結構，這裡簡單起見，只分析二級stacking。假設我們有3個基模型m1 m2 m3。基模型m1，對訓練集train訓練，然後用於 train和test的標籤列，將的訓練集和測試集的結果即出的y 分別作為p1，t1 對於m2和m3，重複相同的工作，這樣也得...