金融風控模型

2021-10-04 09:33:05 字數 956 閱讀 3216

#工作中暫時未涉及。此處為有幸得到的ppt。記錄學習內容,還有些心得,有錯誤請指出,感激

什麼是欺詐風險

網路借款人是否是本人

網路借款人提交的資料是否真實

什麼是信用風險

網路借款人是否有還款的能力

是否是沒有還款意願的老賴,多次違約

貸款公司如何防範以上兩種風險

針對乙個p2p借款的流程來說,借款人輸入身份證資訊,手機號,卡號等資訊,系統內有決策引擎,反欺詐引擎,還有人工去審核。最後輸出借款人可以借到的金額(授信額度),貸款利率

評分模型

挖掘資料中蘊含的行為模型,信用特徵等和未來信用表現的關係。簡而言之就是從一些獲得的特徵中評估違約概率,收益潛力大小,接受營銷的概率等

風險評分模型開發步驟

-模型設計:設定觀察期,比如去年一年。表現期,比如現在的時間點到明年今日。設定排除規則,比如最近一年沒有交易。設定好壞定義,比如有逾期2個月為壞,超過6期準時還款為好

-資料準備:客戶資訊,徵信資訊,分層抽樣,比例抽樣。資料符合質量和內容

細分分析:對不同群體分開設定評分卡。

特徵衍生:統計資訊,對比資訊,變化趨勢,以及變數的組合。eg:頻率次數排名佔比,時間維度,聚合維度。iv值篩選變數(woe變換和iv值)

特徵篩選:預處理空值屬性,無關變數(選取iv>0.01,或者top3500個iv—聚類選取1000變數—遞迴特徵消除—變數顯著性,bivar,vif,業務的可解釋性)

模型開發:模型選擇,調優,防止過擬合

評估和驗證:

過擬合

訓練集誤差很小,泛化誤差很大

過擬合解決方法樣本偏斜問題

指參與分類的資料集之前數量級相差較大。

這塊沒怎麼看懂。過兩天補

解決方案:欠取樣

金融風控5 模型融合

stacking vs.blending stacking 將若干基學習器獲得的 結果,將 結果作為新的訓練集來訓練乙個學習器。假設有五個基學習器,將資料帶入五基學習器中得到 結果,再帶入模型六中進行訓練 但是由於直接由五個基學習器獲得結果直接帶入模型六中,容易導致過擬合。所以在使用五個及模型進行 ...

金融風控專案

一 問題定義 金融的核心是風險控制。自然而然地,ai的主戰場也變成了如何使用ai技術精準的做風險控制。在風控領域,有乙個很重要的問題是 如何通過使用者的資訊來判斷使用者的逾期與否?我們通過收集使用者的基本資訊 地域資訊 社交資訊等來判斷乙個人的逾期概率。資料如下 二 roc與auc 特徵工程 第一 ...

金融風控資料

anthor 小李江湖 date 2020 9 15 好記性不如爛筆頭!最近報名參加阿里天池金融風控貸款違約 大賽,學習資料分析方法,以賽學習,在此記錄學習的過程,總結參加大賽的方法。1.1 參賽目的阿里天池平台為初學者提供學習平台,為大神提供展示才華平台。本人一直在學習的門口遲遲徘徊無法入門,藉此...