金融資料3

2021-09-12 02:03:02 字數 1723 閱讀 5441

from sklearn.linear_model import logisticregression

from sklearn.svm import svc

from sklearn.tree import decisiontreeclassifier

from sklearn.ensemble import randomforestclassifier

from xgboost import xgbclassifier

from sklearn.model_selection import train_test_split

from sklearn.metrics import accuracy_score

x_train, x_test, y_train, y_test = train_test_split(df.drop('status', axis=1), df['status'], test_size=0.3, random_state=2018)
邏輯回歸

ltc = logisticregression()

ltc.fit(x_train, y_train)

predicted = ltc.predict(x_test)

accuracy_score(y_test, predicted)

0.7477224947442186

svm

svc = svc()

svc.fit(x_train, y_train)

predicted = svc.predict(x_test)

accuracy_score(y_test, predicted)

0.7484232655921513

決策樹

dtc = decisiontreeclassifier()

dtc.fit(x_train, y_train)

predicted = dtc.predict(x_test)

accuracy_score(y_test, predicted)

0.7484232655921513

隨機森林

rfc = randomforestclassifier()

rfc.fit(x_train, y_train)

predicted = rfc.predict(x_test)

accuracy_score(y_test, predicted)

0.7687456201822004

xgboost

在利用xgboost進行資料你和時,發現報錯了,在檢查特徵型別時,發現「cust_id_bin」特徵型別為"category"型別的,無法進行擬合,為了簡單,我這裡就直接刪除了這個特徵。。。

x_train.drop('cust_id_bin', axis=1, inplace=true)

x_test.drop('cust_id_bin', axis=1, inplace=true)

xgb = xgbclassifier()

xgb.fit(x_train, y_train)

xgb.predict(x_test)

accuracy_score(predicted, y_test)

0.7687456201822004

金融資料採集

陽光金融p2c 陽光網際網路金融服務平台 p2c,p2p 眾籌平台,信用評估模型,金融資料採集,分析,網際網路金融,資訊化,定製開發,專注北京,天津,河北,山東區域,面向金融企業,金融機構。p2p 金融資料採集,網際網路金融,網貸平台,金融管理系統,金融資訊化,信用評估模型 資訊管理 陽光網路致力於...

金融資料2

從這裡可以發現每個特徵彼此之間的相關性。這裡我選取了與 status 最相關的10個特徵 這裡一共篩選出49個特徵 def woe x,y,event 1 res woe iv dict for feature in x.columns x x feature values 1 連續特徵離散化 if...

金融資料4

from sklearn.metrics import accuracy score,recall score,f1 score,roc auc score,roc curve,precision score from matplotlib import pyplot as plt 定義評估函式 d...