金融風險管理中,對於乙個借款人還款能力的評估十分重視。如果乙個人的資產負債比過大,一旦發生資不抵債的現象,金融機構繼續對其發放貸款發生違約的風險是極大的。
在體現借款人甚至借款企業還款能力的眾多指標中,多頭借貸是一項核心指標。
1.什麼是多頭借貸
多頭借貸是指單個借款人向2家或2家以上的金融機構提出借貸需求的行為。多頭借貸資料一般至少會粗分成銀行類多頭借貸、非銀類多頭借貸。按時間跨度可以分為近7天、近15天、近1個月、近3個月、近6個月、近12個月。
多頭借貸除了會統計申請次數,還會統計申請機構數、申請最大間隔天數、申請最小間隔天數、申請記錄月份、平均每月申請次數(有申請月份平均)、最大月申請次數、最小月申請次數等。
由於單個使用者的償還能力是有限的,向多方借貸必然蘊含著較高的風險。一般來說,當借貸人出現了多頭借貸的情況,說明該借貸人資金出現了較大困難,有理由懷疑其還款能力。
2.多頭借貸資料的分析方法
由於多頭借貸可以比較有效的反應借款人的還款能力,所以在對借款人信用風險、欺詐風險評估上,基本都有使用多頭借貸資料。
多頭借貸作為乙個衡量借款人的維度特徵,可以結合一些逾期指標進行分析。
上圖示例1中,對近7天非銀機構申請機構平台數進行分析,對申請不同平台數的客戶,分別統計客群的分布佔比、fpd30%、fpd30-dpd90+%、通過單量、fpd30單量、dpd90+單量以及dpd90+%。通過統計後的資料,分析近7天申請n平台數的客戶,其不同逾期指標的變化趨勢,如上圖示例1中fpd30%的增幅,進一步用於尋找策略切點或者豁免客群的回顧分析。
3.多頭借貸資料為何少用於模型
多頭借貸少出現在模型變數中,主要有兩個方面原因。
第一,多頭借貸資料往往被策略同事應用於規則中。
資料建模的目的是從金融弱變數中通過特徵工程方法,提煉出有效區分變數,構建評分模型。所以對於多頭借貸資料,既然已經運用在策略規則中,實在沒必要加入到模型變數。如果讀者朋友們看到提交的評分模型報告中有多頭借貸變數,那麼建模的同事要麼沒有事先了解已上線執行的策略規則集,要麼就是為了模型表現指標(如ks、ar、auc)好看強行使用。
第二,多頭借貸資料往往覆蓋度不全。
多頭借貸雖然是乙個與風險強關聯的維度,但其查得率一直被人所詬病。
舉乙個例子,借款人乙個月內在多家機構貸款,作為乙個特徵,很有可能出現某個人雖然頻繁貸款,但並沒有被多頭**商捕捉到。一旦這個特徵作為模型變數,那麼這個變數的雜訊就很大了。反而如果做成反欺詐策略,就不需要擔心雜訊問題,直接選取拒絕線進行截斷,最大的影響,也就是沒有拒絕掉足夠多的使用者,而這個影響我們還可以用雜訊較小的模型進行彌補。
4.多頭借貸資料在策略規則上的應用
多頭借貸在策略上一般作為一條策略規則,乙個拒絕維度參與到整個風控流程中。不同機構,不同信貸產品,不同場景,對於多頭借貸的拒絕線劃分都是不一樣的。如何找到當下最適合的多頭借貸拒絕線,對於風控策略分析人員,是風控工作的核心任務。
仍以上圖示例1為例,假設當前對於7天多平台數規則的拒絕線劃分在6,即如果7天多平台數》=7則拒絕。如果我們現在希望通過7天多平台數規則豁免一部分客群提公升整體通過率,此時的拒絕線cutoff應該劃分在**呢?
如果不是應對緊急調整通過率的情況,我們可以事先豁免7天多平台數7-10的客戶,作為測試樣本,用以產生7-10客群通過單量的分布,之後將拒絕線調回6。既可以生成如下統計分析表:
上圖示例2中的桔色部分都是通過分析**出來,比如通過上圖示例1中不同多平台數fpd30%的平均增幅0.7%,**出7-10的fpd30%。
預估計算公式8fpd30%=7fpd30%+0.7%。進一步計算出fpd30量、dpd90量等其他指標。
**提醒讀者朋友們,**因為我們對於資產風險管控最關心的逾期指標還是不良率,所以我們通過fpd30-dpd90+%的遷徙率**出不同7天多平台數的dpd90+%。對於7-10的fpd30-dpd90+%預估,可以採用max(0-6的fpd30-dpd90+%)的預估方法。
在這之後,我們對於不同7天多平台數測算出拒絕線cutoff的fpd%和dpd%,如下圖所示:
對比示例圖1和圖3的cutoff_dpd%可以發現,規則拒絕線設定在》=7時dpd%=3.0%,設定在》=8時dpd%=3.0%,設定在》=9時dpd%=3.3%。規則拒絕線設定在》=8的dpd%並沒有增加。此時可以嘗試建議將7天多平台數的拒絕線調整到7。
當然,這種策略分析方法仍有一些紕漏,比如此方法需要有測試樣本進行觀測,無法滿足快速調整通過率的需求;7天多平台數的fpd30%的增幅實際情況並非線性增長,有經驗的策略分析師知道,fpd30%一定會在某乙個節點指數級增長。
但正是因為策略分析師通過不斷地按照上述方法進行樣本測試對照,根據實際情況回顧分析結果,才能不斷的積累策略調整經驗,才會對規則分布具有一定敏感性。這就是策略分析專家與普通策略分析師之間的差距。
風險管理之路,一直在不斷的試錯中找到最優解,與大家共勉之。
大資料風控在信貸行業的應用
大資料風控是基於龐大的資料通過技術方式構建模型對借款人進行風險控制和風險提示,風控的目的是對好壞使用者進行識別從而降低損失,對使用者資質進行分層從而獲取更大的利潤。目前,大資料風控主要圍繞以下幾個方面展開 1.驗證申請人身份 對申請人身份 運營商 銀行卡 學歷等方面的資訊進行核驗,呼叫活體識別,身份...
金融風控 探索性資料分析
乾貨放前面 常常存在資料維度過大而用data.head 時候會有列中存在省略號的情況 此次金融風控可能無法直接看到n1到n14的所有資訊,可用下面解決 1最大展示60列 pd.set option display.max columns 60 最大展示60行 pd.set option displa...
金融風控 task02資料分析
檢視含缺失值列數 print f there are columns in train dataset with missing values.缺失率視覺化 missing data train.isnull sum len data train missing missing missing 0 ...