可以用於形成特徵矩陣的共有5個表:
1.使用者基本屬性表
2.銀行流水記錄表
3.使用者瀏覽行為表
4.信用卡賬單記錄表
5.放款時間資訊表
字段注釋
1使用者id整數2
性別列舉值(0表示性別未知)3職業
列舉值4
教育程度
列舉值5
婚姻狀況
列舉值6
戶口型別
列舉值 1.職業做one-hot編碼
2.教育程度做one-hot編碼
3.婚姻狀況做one-hot編碼
4.戶口型別做one-hot編碼
字段注釋
1使用者id整型2
時間戳整型(0表示未知)
3交易型別
列舉值(1表示收入,0表示支出)
4交易金額
浮點型5
工資收入標記
列舉值(1表示工資收入)
1.時間戳按星期分箱
2.時間戳按月分箱
3.時間戳是否工作日
4.工資收入標記做one-hot編碼
5.交易型別與交易金額做正負數值交易金額字段
字段注釋
1使用者id整型2
時間戳整數(0表示未知)
3瀏覽行為資料整型4
瀏覽子行為編號
列舉型 1.時間戳按星期分箱
2.時間戳按月分箱
3.時間戳是否工作日
4.瀏覽子行為做one-hot編碼
5.瀏覽子行為做統計計數
字段注釋
1使用者id整型2
賬單時間戳
整數(0表示未知)
3銀行id
列舉型4
上期賬單金額
浮點型5
上期還款金額
浮點型6
信用卡額度
浮點型7
本期賬單餘額
浮點型8
本期賬單最低還款額
浮點型9
消費筆數
整數10
本期賬單金額
浮點型11
調整金額
浮點型12
迴圈利息
浮點型13
可用金額
浮點型14
預借現金額度
浮點型15
還款狀態
列舉值 1.賬單時間戳按星期分箱
2.賬單時間戳按月分箱
3.賬單時間戳是否工作日
4.銀行id做one-hot編碼
5.信用卡額度是否低於某個值
6.上期還款金額是否低於某個值
7.上期賬單金額是否高於某個值
8.本期賬單餘額是否高於某個值
9.本期最低還款額是否高於某個值
10.消費筆數是否高於某個值
11.本期賬單金額是否高於某個值
12.迴圈利息是否高於某個值
13.可用金額是否高於某個值
14.預借現金額度是否高於某個值
15.還款狀態做one-hot編碼
16.信用卡計數
17.每個使用者在不同銀行的每張信用卡信用額度的聚合計算,包括最大值、最小值、均值和標準差。
字段注釋
1使用者id整型2
放款時間
整數 1 放款時間按星期分箱
2 放款時間按月分箱
3 放款時間是否工作日
4.放款時間期間是否有銀行賬單或者信用賬單突變
特徵工程.png
特徵工程中的大部分特徵可以分為2類:
1.基於時間視窗對連續變數做統計特徵,這是特徵工程中常用的方法,尤其是對於乙個使用者對應多條記錄的資料表。第一,通過這些統計特徵可以提取出使用者在某個變數上大致的分布情況;第二,這為特徵工程帶來大量細分化且包含資訊量大的特診。
2.每個使用者在特殊時間點的具體特徵值,這些時間點包括最初、最終以及貸款前後,這些時間點所包含的資訊量比一般時間點要大,與**目標值的關聯程度也更大。
「個人信用檔案」
個人信用資訊基礎資料庫執行3.4億人有信用檔案 2007 年11月24日 星期六13 51 個人信用檔案 收錄的個人信貸餘額已佔全國個人消費信貸餘額的97.5 有這樣乙個故事廣為流傳 一位中國留學生在美國準備貸款買房,銀行一查他的 個人信用檔案 發現他在6年前有一筆80多美元的 賬單沒付。他努力回憶...
徵信中心個人信用報告查詢,個人信用記錄怎麼查
經常提到個人信用報告和信用記錄,那麼信用記錄是怎麼查詢呢?查詢個人信用記錄方法主要有兩種 1 帶上本人身份證,親自到當地中國人民銀行分行查詢。一般來說在各地人民銀行的分行和部分商業銀行也是有授權可以列印信用報告的。在人行分行可查詢個人信用報告,在報告中可檢視自己是否辦理了信用卡,辦理了幾張信用卡以程...
個人信用報告今起可上網查詢
個人信用資訊網路查詢步驟 許多人有這樣的經歷 著急辦房貸,等到銀行審核才知道,有一張久未使用的信用卡還欠著費。今後,這樣的尷尬有望避免。10月28日起,繼江蘇 四川 重慶3省市試點之後,央行個人信用報告網上查詢服務試點擴至9省份,增加北京 山東 遼寧 湖南 廣西 廣東6個試點省份。27日,記者試著登...