目前金融申請評分卡主要使用在一些網際網路金融企業和保險銀行機構,主要用來解決目前金融機構存在的信用風控問題。
從最早的有抵押無規則→無抵押有規則→資料模型,形成了目前在風控領域的基本風控脈絡;現今主要採用基於資料驅動建立的風控模型,主要就是目前應用最廣泛最多的評分卡模型,評分卡模型主要由分為四種,即:
評分卡模型
申請評分卡
行為評分卡
催收評分卡
反欺詐評分卡
其中最重要的就是金融申請評分卡,目的是把風險控制在貸前的狀態;也就是減少交易對手未能履行約定契約中的義務而造成經濟損失的風險,裡面由包括了個人違約、公司違約、主權違約,這裡僅僅只講到個人違約;
評分卡模型主要有以下這麼幾個概念:
申請評分卡用在申請環節,以申請者在申請當日及過去的資訊為基礎,**未來放款後的逾期或者違約的概率。
開發申請評分卡的目的有:
我們一般**未來放款後的逾期,這個未來的時間段,在我工作經歷當中,一般是一年左右,時間更長就是用行為評分卡,或許在銀行等大型機構,因為收集的資訊更全面,在評分方面的要求不一樣,可能對未來的**時間也不一樣,或許時間會更長。
優秀的評分卡應該具備的特性:
1. 穩定性:當總體逾期/違約概率不變,分數的分步也應該沒有改變
2. 區分性:違約人群與正常人群的分數應當有顯著的差異,具體如下圖所示:
3. **能力:低分人群的違約率更高
4. 和逾期概率等價:評分應該可以精準地反應違約/逾期概率,反之亦然
啟動:場景、物件、目的
資料準備與預處理:賬戶、客戶、內部和外部資料的匯集抽取和清洗
模型構建:基本就是邏輯回歸,也可能用到整合學習(隨機森林是整合學習的特例)
模型的評估:區分度、**性、平穩性(看分數的分步情況)
驗證/審計:是否有計算錯誤、邏輯錯誤、業務錯誤
模型部署:開發環境→生產環境、容量、併發度
模型監控:模型效能是不是比較穩定
備註一下:
截止目前,看到的評分卡模型基本都是用邏輯回歸開發的,優點比較多,穩定和解釋性強,解釋性強因為在對比其他分數期間,邏輯回歸相對是有多個可加項,可具體比較,svm就基本做不到,缺點是對資料質量的要求非常高,需要在資料預處理方面花很多的時間,模型的簡單但是開發成本並不低;決策樹模型方面,對資料質量要求低,也比較容易解釋,但是模型的準確度不高;組合模型方面,部署比較麻煩,在評分卡方面應用不是很多。
備註:客戶還款能力*還款意願 = 還款等級
這裡我提供乙份資料,其中字段如下:
欄位名稱
member_id
idloan_amnt
申請額度
term
產品期限
int_rate
利率emp_length
工作期限
home_ownership
是否有自有住宅
annual_inc
年收入verification_status
收入核驗狀態
desc
描述purpose
貸款目的
title
貸款目的描述
zip_code
addr_state
聯絡位址所屬州
delinq_2yrs
申貸日期前2年逾期次數
inq_last_6mths
申請日前6個月諮詢次數
mths_since_last_delinq
上次逾期距今月份數
mths_since_last_record
上次登記公眾記錄距今的月份數
open_acc
徵信局中記錄的信用產品數
pub_rec
公眾不良記錄數
total_acc
正在使用的信用產品數
pub_rec_bankruptcies
公眾破產記錄數
earliest_cr_line
第一次借貸時間
loan_status
貸款狀態—目標變數
在評分卡模型中,經常遇到的問題就是非平衡樣本的問題。在乙個樣本裡面,壞的樣本很少或者好的樣本很少,導致了資料的不平衡。在處理資料不平衡樣本中,一般有三種辦法:
smote演算法原理:
取樣最近鄰演算法,計算出每個少數類樣本的k個同類近鄰;
從k個同類近鄰中隨機挑選n個樣本進行隨機線性插值;
構造新的少數類樣本: ne
w=xi
+ran
d(0,
1)∗(
yj−x
i),j
=1,2
,3,4.....
n new
=xi+
rand
(0,1
)∗(y
j−xi
),j=
1,2,
3,4.....
n其中xixi
為少類中的乙個觀測點,yjyj
為k個近鄰中隨機抽取的樣本
將新樣本與原資料合成,產生新的訓練集
例子:選取了乙個x1
x
1為年齡為22歲,月收入為8000元,則x1
=(22,
8000
) x1=
(22,8000
),選取了乙個近鄰點為x2
x
2,x2
=(28,
5000
) x2=
(28,5000
),隨機係數為0.5,計算邏輯為22+
(28−22
)∗0.5=25,
8000+(
5000
−8000)∗
0.5=
650022+
(28−22
)∗0.5=25,
8000+(
5000
−8000)∗
0.5=
6500
,這樣得到的乙個新的x3
x
3點為(25
,6500
) (25,
6500)。
金融風控 申請評分卡模型 申請評分卡介紹
從這篇博文開始,我將總結金融風控中的另外乙個模型 申請評分卡模型。這篇博文將主要來介紹申請評分卡的一些基本概念。本篇博文將以以下四個主題來進行介紹說明 交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預期收益與實際收益發生偏離的可能性它是金融風險的主要...
金融申請評分卡 目標變數界定
一 目標變數是什麼?目標變數就是假定申請客戶的好壞,邏輯回歸公式裡的y,先來看下邏輯回歸公式 y 11 e zy 1 1 e zz a 1x1 a2x2 a nxn b z a 1x1 a2x2 a nxn b其中 y 11 e zy 1 1 e z稱為sigmoid函式,它的函式影象如下,我們可以...
申請評分卡(A卡)的開發過程(1)
本篇文章上接 申請評分卡簡介 有需要的童鞋可以參考下 下面介紹下a卡的開發步驟。1 立項 場景 營銷 信貸領域 物件 個人 賬戶 公司 目的 程度決策 流失預警 反欺詐等等 2 資料的準備與預處理 賬戶,客戶,內部外部資料 3 建模的構建 邏輯回歸vs機器學習,單一模型vs 整合模型 4 模型評估 ...