一、目標變數是什麼?
目標變數就是假定申請客戶的好壞,邏輯回歸公式裡的y,先來看下邏輯回歸公式 y=
11+e
−zy =1
1+e−
zz=a
1x1+
a2x2
+⋯+a
nxn+
b z=a
1x1+
a2x2
+⋯+a
nxn+
b其中 y=
11+e
−zy =1
1+e−
z稱為sigmoid函式,它的函式影象如下,
我們可以看到,通過sigmoid函式輸出的y介於(0,1)之間,這樣就表明了資料屬於某一類別的概率,例如:
假定y定義為申請客戶為好客戶還是壞客戶,也就是歷史資料非0(好客戶)即1(壞客戶),通過測算業務放款收益損失我們找到了乙個公司可接受的逾期率p
y小於p,則說明**客戶有更大的概率屬於好客戶;
y大於p,則說明**客戶有更大的概率屬於壞客戶;
當然實際情況好壞客戶的劃分並沒有這麼簡單,單單是收益損失測算就需要考慮綜合費率、資金成本等較多維度。
二、目標變數的界定
對於評分卡目標變數y的界定,我們主要從roll rate和vintage來觀察分析,重點需要考慮三個方面
1) 逾期流轉比例
2) 觀察期和表現期
3) 樣本容量
先分析roll rate
roll rate的定義為在當前催收水平下不同逾期天數轉化為壞賬的概率。從roll rate我們看到2023年開始放款,m0 to m1的流轉率約為7.8%,m3 to m4的流轉率為100%,也就是說,處於m3逾期階段內的客戶基本很難催收,逾期天數大於60天的客戶基本為壞客戶了。
再分析vintage
vintage可以關注如下幾個方面:
1) 觀察每月審批通過客戶後第n個月的逾期比率,對比每月波動,通常波動與審批策略調整有關,此波動在資料準備階段的樣本抽樣過程需要關注;
2) 逾期分布,集中在通過後的前三個月說明審批的策略有待改進,超過三個月之後才慢慢增加,說明貸中的管理有待提高;
3) 確定逾期率在經歷第n期趨於穩定;
從上圖vintage分析,每月放款逾期m2+以上的剩餘本金逾期率基本在mob=8期時趨於穩定,如果我們的放款時間累積比較長,樣本表現期可以覆蓋到8期,那麼就可以界定樣本目標變數為在8期內(對於銀行往往表現期》8;消費金融<8)逾期天數大於60天的客戶為壞客戶,也就是y=1;如果樣本的表現期不夠8期,那我們就要再綜合考慮流轉率和帳齡,重新定義滿足樣本表現期的逾期天數。
總結一句話,變數界定多考慮,看完流轉看帳齡。
金融申請評分卡(1)
目前金融申請評分卡主要使用在一些網際網路金融企業和保險銀行機構,主要用來解決目前金融機構存在的信用風控問題。從最早的有抵押無規則 無抵押有規則 資料模型,形成了目前在風控領域的基本風控脈絡 現今主要採用基於資料驅動建立的風控模型,主要就是目前應用最廣泛最多的評分卡模型,評分卡模型主要由分為四種,即 ...
金融風控 申請評分卡模型 申請評分卡介紹
從這篇博文開始,我將總結金融風控中的另外乙個模型 申請評分卡模型。這篇博文將主要來介紹申請評分卡的一些基本概念。本篇博文將以以下四個主題來進行介紹說明 交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預期收益與實際收益發生偏離的可能性它是金融風險的主要...
金融申請評分卡 資料準備 造衍生變數
評分卡開發在資料整理好之後,我們的重點工作就是創造衍生變數了!造衍生變數是整個開發評分卡模型過程中最重要 最艱辛也最有趣的乙個節點。最重要是因為衍生變數的好壞往往會影響評分卡模型的各種測評指標,決定策略的反欺詐能力 最艱辛是因為造衍生變數除了要基於業務變數理解之外還要開發人員大開腦洞組合基礎變數,有...