本篇文章上接《申請評分卡簡介》,有需要的童鞋可以參考下:
下面介紹下a卡的開發步驟。
1、立項:場景(營銷、信貸領域)、物件(個人、賬戶、公司)、目的(程度決策、流失預警、反欺詐等等)
2、資料的準備與預處理(賬戶,客戶,內部外部資料)
3、建模的構建(邏輯回歸vs機器學習,單一模型vs 整合模型)
4、模型評估(區分度,**性,穩定性)
5、驗證(是否有計算錯誤,邏輯錯誤,業務錯誤)
6、部署(從開發環境到生產環境、容量、併發度)
7、監控(效能是否減弱,是否需要重新訓練等)
邏輯回歸
優點:簡單,穩定,可解釋,技術成熟,易於監測和部署
缺點:準確度不高
決策樹優點:對資料質量要求低,易解釋
缺點:準確度不高
其他元模型
組合模型
優點:準確度高,不易過擬合
缺點:不易解釋;部署困難;計算量大
申請評分卡常用的特徵
1、個人資訊 :學歷(核查學歷) 性別 收入(流水、社保、公積金來側面檢視)
2、負債資訊 :在本金融機構或者其他金融機構負債情況 (在房貸、信用卡領域應用較多)
3、消費能力 :商品購買紀錄,出境遊,奢侈品消費 ()
4、歷史信用記錄 :歷史逾期行為 (第三方介面檢視)
5、新興資料: 人際社交 網路足跡 出行 個人財務(人際社交:通過與老賴的關係來判斷他的人品(即還款意願);出行:通過看這個人的出行交通工具判斷這個人的經濟能力(還款能力))
1、4可以看出還款意願;2、3可以看出還款能力。還款意願*還款能力=評分卡分數等級
欄位名稱
member_id
idloan_amnt
申請額度
term
產品期限
int_rate
利率emp_length
工作期限
home_ownership
是否有自有住宅
annual_inc
年收入verification_status
收入核驗狀態
desc
描述purpose
貸款目的
title
貸款目的描述
zip_code
addr_state
聯絡位址所屬州
delinq_2yrs
申貸日期前2年逾期次數
inq_last_6mths
申請日前6個月諮詢次數
mths_since_last_delinq
上次逾期距今月份數
mths_since_last_record
上次登記公眾記錄距今的月份數
open_acc
徵信局中記錄的信用產品數
pub_rec
公眾不良記錄數
total_acc
正在使用的信用產品數
pub_rec_bankruptcies
公眾破產記錄數
earliest_cr_line
第一次借貸時間
loan_status
貸款狀態—目標變數
非平衡樣本的定義
在分類問題中,每種類別的出現概率未必均衡例:
非平衡樣本的隱患
非平衡樣本的解決方案
過取樣(對資料採集過多)
欠取樣 (對資料採集過少)
smote(合成少數過取樣技術)
資料格式的處理原始資料帶有一定的格式,需要轉換成正確的格式。
例如:利率 日期
工作年限
文字類的資料的處理方式
主題提取(npl)缺失值的處理優點:提取準確、詳細的資訊,對風險的評估非帝有效
缺點:npl的模型較為複雜,且需要足夠多的訓練樣本
編碼優點:簡單
簡單缺點:資訊丟失很高
缺失在資料分析的工作是頻繁出現的。
缺失的種類
處理的方法
常用的特徵衍生
求和:過去1年內的**消費總額
比例:貸款申請額度與年收入的佔比
時間差:第一次開戶距今時長
波動率:過去3年內每份工作的時間的標準差
特徵的分箱(為什麼要分箱)
分箱的定義
將連續變數離散化(將連續的變數分為多個離散的類別將特徵分類別即收入1000-5000之間為一箱即乙個類別)
將多狀態的離散變數合併成少狀態(盡可能的減小類別的數量)
分箱的重要性
分箱的優勢
分箱的限制
金融申請評分卡(1)
目前金融申請評分卡主要使用在一些網際網路金融企業和保險銀行機構,主要用來解決目前金融機構存在的信用風控問題。從最早的有抵押無規則 無抵押有規則 資料模型,形成了目前在風控領域的基本風控脈絡 現今主要採用基於資料驅動建立的風控模型,主要就是目前應用最廣泛最多的評分卡模型,評分卡模型主要由分為四種,即 ...
金融風控 申請評分卡模型 申請評分卡介紹
從這篇博文開始,我將總結金融風控中的另外乙個模型 申請評分卡模型。這篇博文將主要來介紹申請評分卡的一些基本概念。本篇博文將以以下四個主題來進行介紹說明 交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預期收益與實際收益發生偏離的可能性它是金融風險的主要...
評分卡製作過程
1 明確目的,要用評分卡去對什麼打分 2 對資料進行分析 3 缺失值處理。計算缺失率,對於缺失率低的變數,如果該變數有值的樣本與其他變數相館較高,足以建立乙個模型進行 則可建立模型進行 否則可根據情況,用眾數 均值填充,或者單獨賦乙個值 4 構造衍生變數。根據已知變數和實際情況構造對因變數可能有影響...