task2 金融風控資料處理

2021-10-09 14:18:11 字數 1483 閱讀 9922

目的:

1、了解整個資料集的基本情況(缺失值,異常值),對資料集進行驗證是否可以進行接下來的機器學習或者深度學習建模.

2、了解變數間的相互關係、變數與**值之間的存在關係。

資料型別:

特徵變數:

變數名解釋:

id 為貸款清單分配的唯一信用證標識

loanamnt 貸款金額

term 貸款期限(year)

interestrate 貸款利率

installment 分期付款金額

grade 貸款等級

subgrade 貸款等級之子級

employmenttitle 就業職稱

employmentlength 就業年限(年)

homeownership 借款人在登記時提供的房屋所有權狀況

annualincome 年收入

verificationstatus 驗證狀態

issuedate 貸款發放的月份

purpose 借款人在貸款申請時的貸款用途類別

regioncode 地區編碼

dti 債務收入比

delinquency_2years 借款人過去2年信用檔案中逾期30天以上的違約事件數

ficorangelow 借款人在貸款發放時的fico所屬的下限範圍

ficorangehigh 借款人在貸款發放時的fico所屬的上限範圍

openacc 借款人信用檔案中未結信用額度的數量

pubrec 貶損公共記錄的數量

pubrecbankruptcies 公開記錄清除的數量

revolbal 信貸周轉餘額合計

revolutil 迴圈額度利用率,或借款人使用的相對於所有可用迴圈信貸的信貸金額

totalacc 借款人信用檔案中當前的信用額度總數

initialliststatus 貸款的初始列表狀態

earliescreditline 借款人最早報告的信用額度開立的月份

title 借款人提供的貸款名稱

policycode 公開可用的策略_**=1新產品不公開可用的策略_**=2

n系列匿名特徵 匿名特徵n0-n14,為一些貸款人行為計數特徵的處理

金融風控 Task01

題目理解 通過這道賽題來引導大家走進金融風控資料競賽的世界,主要針對於於競賽新人進行自我練習 自我提高。指標 分類演算法常見的評估指標如下 1 混淆矩陣 confuse matrix 2 準確率 accuracy 3 精確率 precision 4 召回率 recall 5 f1 score 6 p...

金融風控資料

anthor 小李江湖 date 2020 9 15 好記性不如爛筆頭!最近報名參加阿里天池金融風控貸款違約 大賽,學習資料分析方法,以賽學習,在此記錄學習的過程,總結參加大賽的方法。1.1 參賽目的阿里天池平台為初學者提供學習平台,為大神提供展示才華平台。本人一直在學習的門口遲遲徘徊無法入門,藉此...

金融風控學習task1

其中有四種情況 1 若乙個例項是正類,並且被 為正類,即為真正類tp true positive 2 若乙個例項是正類,但是被 為負類,即為假負類fn false negative 3 若乙個例項是負類,但是被 為正類,即為假正類fp false positive 4 若乙個例項是負類,並且被 為負...