大資料風控 信用模型新老模型對比

2021-09-25 08:58:06 字數 532 閱讀 9144

乙個模型部署上線之前,我們要進行更新迭代,如何對新老模型做乙個效果對比分析呢?下面將介紹幾個常用的方法

常用的模型評估指標,如:roc、auc、ks、gini值越大,區分度越高,模型效果越好;rmse,越小模型越好;

將建模樣本、test樣本或者oot(out of time)資料,根據模型評分大小順序排序,切分成20等分,計算每組的標籤客戶佔比,如下圖1:

新模型明顯在最後2個等級對壞客戶的區分度較為明顯,如果我們將通過率設定在90%,在19、20兩個等級上壞客戶區分度上提公升2個百分點以上;將分組逾期率化成2條lift曲線(下圖2),明顯新模型相對平滑,而且在19、20等分上新模型斜率高於老模型,證明新模型區分度好於老模型,可以進行更新迭代。

20份切分參考:

圖1:

圖2:

金融風控模型

工作中暫時未涉及。此處為有幸得到的ppt。記錄學習內容,還有些心得,有錯誤請指出,感激 什麼是欺詐風險 網路借款人是否是本人 網路借款人提交的資料是否真實 什麼是信用風險 網路借款人是否有還款的能力 是否是沒有還款意願的老賴,多次違約 貸款公司如何防範以上兩種風險 針對乙個p2p借款的流程來說,借款...

金融風控5 模型融合

stacking vs.blending stacking 將若干基學習器獲得的 結果,將 結果作為新的訓練集來訓練乙個學習器。假設有五個基學習器,將資料帶入五基學習器中得到 結果,再帶入模型六中進行訓練 但是由於直接由五個基學習器獲得結果直接帶入模型六中,容易導致過擬合。所以在使用五個及模型進行 ...

金融大資料信用評分模型解析

傳統個人徵信的分析維度包括 1 個人基本資料,如年齡 性別 職業 收入 婚姻狀況 工作年限 工作狀況等 2 信貸情況,主要是信貸和信用卡相關資料 3 公共資料,包括稅務 工商 法院 電信 水電煤氣等部門的資料 4 個人信用報告查詢記錄。如今隨著大資料時代的到來和發展,可用於評估人們的資料越來越豐富,...