PART 1 1 如何確定建模的Y值

2021-09-11 02:40:50 字數 1510 閱讀 5991

最重要的事情開始都會講:建模是始終服務於業務的,沒有業務的評分卡就沒有靈魂

定義y什麼樣的客戶是好客戶

什麼樣的客戶是壞客戶

我認為是首要的,也就是需要有乙個目標,也就是方向要對

拿乙個例子來講:

定義一批客群的好壞:我需要用到該客群從授信前一年的資料集,定義的是逾期30天

從上面可以提取關鍵資訊:

1 觀察點:授信

2 觀察期: 授信前一年

3 表現期:還款到期後30天的具體表現

接下來 劃重點,怎麼取對目標變數y進行界定:

1 roll rate

2 vintage

3 sample (基於資料的表現情況)

roll rate的定義為在當前催收水平下不同逾期天數轉化為壞賬的概率

roll rate2023年開始放款,m0 to m1的流轉率約為7.8%,m3 to m4的流轉率為100%,處於m3逾期階段內的客戶基本很難催收,逾期天數大於60天的客戶基本為壞客戶

再分析vintage

分子是累積的金額/分母是不變的金額 (比如m1 m2)

vintage關注如下方面:

觀察每月審批通過客戶後第n個月的逾期比率

逾期分布,集中在通過後的前三個月說明審批的策略有待改進,超過三個月之後才慢慢增加,說明貸中的管理有待提高

確定逾期率在經歷第n期趨於穩定

從vintage分析,每月放款逾期m2+以上剩餘本金逾期率基本在mob=8期時趨於穩定,如果放款時間累積比較長,樣本表現期可覆蓋到8期,那界定樣本目標變數為在8期內(對於銀行往往表現期》8;消費金融<8)逾期天數大於60天的客戶為壞客戶,也就是y=1;

如樣本表現期不夠8期,再綜合考慮流轉率和帳齡,重新定義滿足樣本表現期逾期天數。

總結一句話,變數界定多考慮,看完流轉看帳齡,觀察期確定x變數,表現期確定y變數

針對申請模型來說,表現期就是客戶申請通過放款,客戶的還款表現

觀察期就是客戶申請點之前需要納入觀察的行為活動資料的時間,即回溯

表現期一般看vintage,vintage在某個mob達到乙個較穩定的壞賬率的時候,即可將此mob作為表現期

最重要的事情最後都會講:建模是始終服務於業務的,沒有業務的評分卡就沒有靈魂

part 11輸入阻抗和輸入電容

下圖形象說明了運放輸入端阻抗的特性,主要有兩個引數 輸入阻抗和輸入電容。對於電壓反饋型運放,輸入阻抗主要由輸入級決定,一般bjt輸入級運放共模輸入阻抗不會大於40m歐,差模輸入阻抗大於200g歐。對於jfet和cmos輸入級運放,輸入阻抗要大得多。這個阻抗通常表現為電阻性。更值得關注的是輸入電容。d...

Part 1 1 基於列舉方法來搭建中文分詞工具

step 1 對於給定字串 我們學習人工智慧,人工智慧是未來 找出所有可能的分割方式 step 2 我們也可以計算出每乙個切分之後句子的概率 step 3 返回第二步中概率最大的結果 def create dic file path workbook xlrd.open workbook file ...

如何確定精度

我們常看到 float 型別是4個位元組,7位有效數字。但是我總是在想為什麼float是7位有效數字,而不是8位,9位,10位?我在baidu,google上搜了一通,發現很多人把float的儲存方式寫的很明白很清楚,但是還是無法解釋為什麼只有7個有效數字,答非所問。7位有效數字,說明第8位是不確定...