授信模型:
芝麻信用
1.身份 穩定性
2.履約能力 兜底性
3.信用歷史 歷史性
4.人脈關係 穩定性+若價值性
5.行為偏好 真正價值
一. 資料變數
1.原始變數
2.衍生變數 時間,函式,比率
在選擇變數的時候,基於rmf,一年的資料
二. 資料處理
迭代優化,前期不會很複雜
數值和字元型缺失性和合理性檢驗
數值型字段相關性驗證
字串欄位的離散性處理
字元型性:一般採用專家打分法
小學 0-20 初中20-40… 所有變數均變為數值
資料標準化:資料在量級和量綱上相差很大,沒有可比性,對所有字段進行標準化,標準化的方式對後面模型效果沒有影響
三. 建模前的思考
在不同時期的權重不一樣,所以每個模型都要單獨建模,在建模前需要把業務目標理一理,這樣才能找到用什麼模型
邏輯上就是:根據使用者的資料,算出違約的概率,而這個概率也可以轉化為使用者的分數,所以邏輯回歸模型可以使用。
假設該模組包含的字段有最近乙個月主動查詢金額機構信用次數x1,最近乙個月需要還貸總額x2,最近乙個月逾期總額x3
那麼其違約的概率
p= 1/(1+e-(ax1+bx2+cx3))
四. 模型離線效果評估
混淆矩陣和roc曲線
roc 曲線:根據混淆矩陣做出的,區分模型能否把好壞樣本分開的乙個圖,一般取roc下面的面積auc,來衡量模型效果
越大越好,一般0.6以上
在實際過程中,最重要的是壞賬率這個評估指標
五. 模型的執行週期
在產品初期,因為模型的變數太多,所以模型的迭代速度非常快,基本每月都要跑一次,可能出現某個使用者分數奇高,這是正常的,這些都需要不斷的調整權重和係數,慢慢優化才行,最終還需要模型落地
六.模型落地
落地場景,模型準確率高才合作
多維度評估,芝麻信用只是乙個參考維度
一般這樣:機器呼叫該使用者央行的徵信,介面呼叫使用者的芝麻分 該使用者在招聯的信用評估情況,結合三者,出一套授信方案,模型基本正式使用
網際網路金融
目錄 網際網路金融分類舉例 指紋識別對手機銀行業務帶來的便利和風險 人臉識別 網際網路金融與傳統金融的五大區別 1.定位不同 2.驅動因素不同 3.模式不同 4.治理機制不同 5.優勢不同 目前網際網路金融大概可以分為六類,其中三種是目前中國執行時間和運作企業比較多,相對比較成熟的,主要是第三方服務...
網際網路金融風控模型
1 網際網路金融前10名排行榜 資料截止日期2017 09 12 1.1 螞蟻金服 1.1.2 人臉識別技術 1.1.3 雲計算技術 1.1.4 風控技術 1.1.5 人工智慧技術 1.2 陸金所風控調研 小結 投資使用者與產品匹配度 1.3 京東金融風控調研 1.3.2 風控的靈魂是資料,所有決策...
笑看網際網路金融
在這個圈子裡面已經摸爬滾打5年之久,但是一直都是逛園子,從來沒有寫過部落格,最近突然想把自己的一些心得分享出來,第一次寫部落格,可能寫的不好,希望大家不要噴,口下留情。今天是我的第一篇部落格,所以也沒有好好的準備,就簡單的寫一些。因為目前工作的原因,接觸了一些網際網路金融方面的知識,之前我對比如說 ...