#工作中暫時未涉及。此處為有幸得到的ppt。記錄學習內容,還有些心得,有錯誤請指出,感激
什麼是欺詐風險
網路借款人是否是本人
網路借款人提交的資料是否真實
什麼是信用風險
網路借款人是否有還款的能力
是否是沒有還款意願的老賴,多次違約
貸款公司如何防範以上兩種風險
針對乙個p2p借款的流程來說,借款人輸入身份證資訊,手機號,卡號等資訊,系統內有決策引擎,反欺詐引擎,還有人工去審核。最後輸出借款人可以借到的金額(授信額度),貸款利率
評分模型
挖掘資料中蘊含的行為模型,信用特徵等和未來信用表現的關係。簡而言之就是從一些獲得的特徵中評估違約概率,收益潛力大小,接受營銷的概率等
風險評分模型開發步驟
-模型設計:設定觀察期,比如去年一年。表現期,比如現在的時間點到明年今日。設定排除規則,比如最近一年沒有交易。設定好壞定義,比如有逾期2個月為壞,超過6期準時還款為好
-資料準備:客戶資訊,徵信資訊,分層抽樣,比例抽樣。資料符合質量和內容
細分分析:對不同群體分開設定評分卡。
特徵衍生:統計資訊,對比資訊,變化趨勢,以及變數的組合。eg:頻率次數排名佔比,時間維度,聚合維度。iv值篩選變數(woe變換和iv值)
特徵篩選:預處理空值屬性,無關變數(選取iv>0.01,或者top3500個iv—聚類選取1000變數—遞迴特徵消除—變數顯著性,bivar,vif,業務的可解釋性)
模型開發:模型選擇,調優,防止過擬合
評估和驗證:
過擬合
訓練集誤差很小,泛化誤差很大
過擬合解決方法樣本偏斜問題
指參與分類的資料集之前數量級相差較大。
這塊沒怎麼看懂。過兩天補
解決方案:欠取樣
金融風控5 模型融合
stacking vs.blending stacking 將若干基學習器獲得的 結果,將 結果作為新的訓練集來訓練乙個學習器。假設有五個基學習器,將資料帶入五基學習器中得到 結果,再帶入模型六中進行訓練 但是由於直接由五個基學習器獲得結果直接帶入模型六中,容易導致過擬合。所以在使用五個及模型進行 ...
金融風控專案
一 問題定義 金融的核心是風險控制。自然而然地,ai的主戰場也變成了如何使用ai技術精準的做風險控制。在風控領域,有乙個很重要的問題是 如何通過使用者的資訊來判斷使用者的逾期與否?我們通過收集使用者的基本資訊 地域資訊 社交資訊等來判斷乙個人的逾期概率。資料如下 二 roc與auc 特徵工程 第一 ...
金融風控資料
anthor 小李江湖 date 2020 9 15 好記性不如爛筆頭!最近報名參加阿里天池金融風控貸款違約 大賽,學習資料分析方法,以賽學習,在此記錄學習的過程,總結參加大賽的方法。1.1 參賽目的阿里天池平台為初學者提供學習平台,為大神提供展示才華平台。本人一直在學習的門口遲遲徘徊無法入門,藉此...