申請評分卡(A卡)的開發過程(1)

2021-10-24 01:19:41 字數 2422 閱讀 2156

本篇文章上接《申請評分卡簡介》,有需要的童鞋可以參考下:

下面介紹下a卡的開發步驟。

1、立項:場景(營銷、信貸領域)、物件(個人、賬戶、公司)、目的(程度決策、流失預警、反欺詐等等)

2、資料的準備與預處理(賬戶,客戶,內部外部資料)

3、建模的構建(邏輯回歸vs機器學習,單一模型vs 整合模型)

4、模型評估(區分度,**性,穩定性)

5、驗證(是否有計算錯誤,邏輯錯誤,業務錯誤)

6、部署(從開發環境到生產環境、容量、併發度)

7、監控(效能是否減弱,是否需要重新訓練等)

邏輯回歸

優點:簡單,穩定,可解釋,技術成熟,易於監測和部署

缺點:準確度不高

決策樹優點:對資料質量要求低,易解釋

缺點:準確度不高

其他元模型

組合模型

優點:準確度高,不易過擬合

缺點:不易解釋;部署困難;計算量大

申請評分卡常用的特徵

1、個人資訊 :學歷(核查學歷) 性別 收入(流水、社保、公積金來側面檢視)

2、負債資訊 :在本金融機構或者其他金融機構負債情況 (在房貸、信用卡領域應用較多)

3、消費能力 :商品購買紀錄,出境遊,奢侈品消費 ()

4、歷史信用記錄 :歷史逾期行為 (第三方介面檢視)

5、新興資料: 人際社交 網路足跡 出行 個人財務(人際社交:通過與老賴的關係來判斷他的人品(即還款意願);出行:通過看這個人的出行交通工具判斷這個人的經濟能力(還款能力))

1、4可以看出還款意願;2、3可以看出還款能力。還款意願*還款能力=評分卡分數等級

欄位名稱

member_id

idloan_amnt

申請額度

term

產品期限

int_rate

利率emp_length

工作期限

home_ownership

是否有自有住宅

annual_inc

年收入verification_status

收入核驗狀態

desc

描述purpose

貸款目的

title

貸款目的描述

zip_code

addr_state

聯絡位址所屬州

delinq_2yrs

申貸日期前2年逾期次數

inq_last_6mths

申請日前6個月諮詢次數

mths_since_last_delinq

上次逾期距今月份數

mths_since_last_record

上次登記公眾記錄距今的月份數

open_acc

徵信局中記錄的信用產品數

pub_rec

公眾不良記錄數

total_acc

正在使用的信用產品數

pub_rec_bankruptcies

公眾破產記錄數

earliest_cr_line

第一次借貸時間

loan_status

貸款狀態—目標變數

非平衡樣本的定義

在分類問題中,每種類別的出現概率未必均衡例:

非平衡樣本的隱患

非平衡樣本的解決方案

過取樣(對資料採集過多)

欠取樣 (對資料採集過少)

smote(合成少數過取樣技術)

資料格式的處理原始資料帶有一定的格式,需要轉換成正確的格式。

例如:利率 日期

工作年限

文字類的資料的處理方式

主題提取(npl)

優點:提取準確、詳細的資訊,對風險的評估非帝有效

缺點:npl的模型較為複雜,且需要足夠多的訓練樣本

編碼優點:簡單

簡單缺點:資訊丟失很高

缺失值的處理

缺失在資料分析的工作是頻繁出現的。

缺失的種類

處理的方法

常用的特徵衍生

求和:過去1年內的**消費總額

比例:貸款申請額度與年收入的佔比

時間差:第一次開戶距今時長

波動率:過去3年內每份工作的時間的標準差

特徵的分箱(為什麼要分箱)

分箱的定義

將連續變數離散化(將連續的變數分為多個離散的類別將特徵分類別即收入1000-5000之間為一箱即乙個類別)

將多狀態的離散變數合併成少狀態(盡可能的減小類別的數量)

分箱的重要性

分箱的優勢

分箱的限制

金融申請評分卡(1)

目前金融申請評分卡主要使用在一些網際網路金融企業和保險銀行機構,主要用來解決目前金融機構存在的信用風控問題。從最早的有抵押無規則 無抵押有規則 資料模型,形成了目前在風控領域的基本風控脈絡 現今主要採用基於資料驅動建立的風控模型,主要就是目前應用最廣泛最多的評分卡模型,評分卡模型主要由分為四種,即 ...

金融風控 申請評分卡模型 申請評分卡介紹

從這篇博文開始,我將總結金融風控中的另外乙個模型 申請評分卡模型。這篇博文將主要來介紹申請評分卡的一些基本概念。本篇博文將以以下四個主題來進行介紹說明 交易對手未能履行約定契約中的義務而造成經濟損失的風險,即受信人不能履行還本付息的責任而使授信人的預期收益與實際收益發生偏離的可能性它是金融風險的主要...

評分卡製作過程

1 明確目的,要用評分卡去對什麼打分 2 對資料進行分析 3 缺失值處理。計算缺失率,對於缺失率低的變數,如果該變數有值的樣本與其他變數相館較高,足以建立乙個模型進行 則可建立模型進行 否則可根據情況,用眾數 均值填充,或者單獨賦乙個值 4 構造衍生變數。根據已知變數和實際情況構造對因變數可能有影響...