入門資料推薦
補充資料採集會涉及到埋點和爬蟲。
反欺詐引擎(模型、無標籤)
反欺詐引擎主要包括兩個部分,反欺詐規則(主要)和反欺詐模型。傳統的監督模型較少的使用到,主要涉及到無監督演算法、社交網路演算法、深度學習、異常檢測、知識圖譜。
規則引擎(策略)
主要通過資料分析、挖掘手段以及一些監督、無監督演算法,得到不同字段、各個區間的壞賬率,找到最佳分段區間,然後篩選信用較好的一批特定人群進行放款。通常是模型與規則組合使用。
風控模型
主要通過監督演算法構建違約概率**模型。但由於實際業務中資料質量問題,通常使用深度學習、無監督或弱監督學習等方法去輔助傳統監督學習演算法。
風控模型中包含了a/b/c卡,其三者的區別如下表所示。
a卡b卡
c卡時間不同
貸前貸中
貸後資料要求不同
一般可做貸款0-1年的信用分析
在申請人有了一定行為後,有了較大資料進行的分析,一般為3-5年
對資料要求更大,需加入催收後客戶反應等屬性資料
y的定義
使用者歷史逾期天數的最大天數
可以多期借款中逾期最大一次的天數
用途不同,定義不同
催收催收是風控的最終手段。這個環節可以產生很多對模型有幫助的資料,例如催收記錄的文字資料、觸達率、欺詐標籤等。
《概率論與梳理統計第四版(浙大)》
《統計學習方法第二版(李航)》
《機器學習(周志華)》
《利用python進行資料分析(第二版)》
《信用評分模型》
姓名、身份證、銀行卡、手機號
金融風控入門賽01
我的機器學習實踐之旅還在繼續,這次我繼續參加了datawhale的組隊學習活動,題目是金融風控。賽題以金融風控中的個人信貸為背景,要求選手根據貸款申請人的資料資訊 其是否有違約的可能,以此判斷是否通過此項貸款,這是乙個典型的分類問題。通過這道賽題來引導大家了解金融風控中的一些業務背景,解決實際問題,...
金融風控 Task01
題目理解 通過這道賽題來引導大家走進金融風控資料競賽的世界,主要針對於於競賽新人進行自我練習 自我提高。指標 分類演算法常見的評估指標如下 1 混淆矩陣 confuse matrix 2 準確率 accuracy 3 精確率 precision 4 召回率 recall 5 f1 score 6 p...
金融風控專案
一 問題定義 金融的核心是風險控制。自然而然地,ai的主戰場也變成了如何使用ai技術精準的做風險控制。在風控領域,有乙個很重要的問題是 如何通過使用者的資訊來判斷使用者的逾期與否?我們通過收集使用者的基本資訊 地域資訊 社交資訊等來判斷乙個人的逾期概率。資料如下 二 roc與auc 特徵工程 第一 ...