目的:
1、了解整個資料集的基本情況(缺失值,異常值),對資料集進行驗證是否可以進行接下來的機器學習或者深度學習建模.
2、了解變數間的相互關係、變數與**值之間的存在關係。
資料型別:
特徵變數:
變數名解釋:
id 為貸款清單分配的唯一信用證標識
loanamnt 貸款金額
term 貸款期限(year)
interestrate 貸款利率
installment 分期付款金額
grade 貸款等級
subgrade 貸款等級之子級
employmenttitle 就業職稱
employmentlength 就業年限(年)
homeownership 借款人在登記時提供的房屋所有權狀況
annualincome 年收入
verificationstatus 驗證狀態
issuedate 貸款發放的月份
purpose 借款人在貸款申請時的貸款用途類別
regioncode 地區編碼
dti 債務收入比
delinquency_2years 借款人過去2年信用檔案中逾期30天以上的違約事件數
ficorangelow 借款人在貸款發放時的fico所屬的下限範圍
ficorangehigh 借款人在貸款發放時的fico所屬的上限範圍
openacc 借款人信用檔案中未結信用額度的數量
pubrec 貶損公共記錄的數量
pubrecbankruptcies 公開記錄清除的數量
revolbal 信貸周轉餘額合計
revolutil 迴圈額度利用率,或借款人使用的相對於所有可用迴圈信貸的信貸金額
totalacc 借款人信用檔案中當前的信用額度總數
initialliststatus 貸款的初始列表狀態
earliescreditline 借款人最早報告的信用額度開立的月份
title 借款人提供的貸款名稱
policycode 公開可用的策略_**=1新產品不公開可用的策略_**=2
n系列匿名特徵 匿名特徵n0-n14,為一些貸款人行為計數特徵的處理
金融風控 Task01
題目理解 通過這道賽題來引導大家走進金融風控資料競賽的世界,主要針對於於競賽新人進行自我練習 自我提高。指標 分類演算法常見的評估指標如下 1 混淆矩陣 confuse matrix 2 準確率 accuracy 3 精確率 precision 4 召回率 recall 5 f1 score 6 p...
金融風控資料
anthor 小李江湖 date 2020 9 15 好記性不如爛筆頭!最近報名參加阿里天池金融風控貸款違約 大賽,學習資料分析方法,以賽學習,在此記錄學習的過程,總結參加大賽的方法。1.1 參賽目的阿里天池平台為初學者提供學習平台,為大神提供展示才華平台。本人一直在學習的門口遲遲徘徊無法入門,藉此...
金融風控學習task1
其中有四種情況 1 若乙個例項是正類,並且被 為正類,即為真正類tp true positive 2 若乙個例項是正類,但是被 為負類,即為假負類fn false negative 3 若乙個例項是負類,但是被 為正類,即為假正類fp false positive 4 若乙個例項是負類,並且被 為負...