我們要做的是**貸款使用者是否會逾期。**中 "status" 是結果標籤:0表示未逾期,1表示逾期。
先對資料進行三七分,隨機種子2018。這裡利用了lr,svm,decisiontree三種模型,並對這三種模型進行評分。
先導入劃分資料和構建模型所需要的各種包。用read_csv函式開啟csv檔案。接著再對資料集進行三七劃分。在獲取訓練集的時候,可以用列表推導法,也可以用drop函式,不過要注意再刪除列的時候要將 axis = 1
importpandas as pd
from sklearn.model_selection import
train_test_split
from sklearn.linear_model import
logisticregression
from sklearn.tree import
decisiontreeclassifier
from sklearn import
svmdata_all = pd.read_csv('
d:\\data_all.csv
',encoding='
gbk')#
features = [x for x in data_all.columns if x not in ['status']]
#x = data_all[features]
x = data_all.drop(['
status
'],axis = 1)
y = data_all['
status']
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3,random_state=2018)
下一步就是分別構建是三種模型了。
#lrlr = logisticregression(random_state = 2018)
lr.fit(x_train, y_train)
#decisiontree
dt = decisiontreeclassifier(random_state = 2018)
dt.fit(x_train , y_train)
#svm
svc = svm.svc(random_state = 2018)
svc.fit(x_train , y_train)
#列印三種模型的得分
(dt.score(x_test,y_test))
(lr.score(x_test,y_test))
print(svc.score(x_test,y_test))
最後得到三種模型的評分
0.68465311843027330.7484232655921513
0.7484232655921513
助力金融機構精準營銷 榕樹貸款智網AI實現風控前置
近日,以 非常時期的金融責任與擔當 為主題的 2020 第五屆新金融論壇在北京舉行。會上指出,當前人工智慧 區塊鏈 雲計算和大資料等技術,在金融領域的應用愈加普遍,支撐金融行業數位化轉型,但是同時也存在著核心技術受制於人和數位化轉型質量不高等問題。專家強調,針對這樣的問題,最關鍵的一點是ptfxsk...
平安普惠用科技帶動金融 實現大跨步貸款提速
當前,中國存在著數以千萬計的小微企業,無論是從數量上還是從產值上來說,它程式設計客棧們都在國民經濟中發揮著舉足輕重的作用,促使中國經濟進入了區別於傳統經濟模式的全新時代。而今年受新冠肺炎疫情衝擊,以及疊加國際形勢複雜多變的不利影響,讓小微企業對貸款資金的需求越發迫切。小微企業貸款融資難 中國速度 遭...
基於決策樹的貸款審批模型
基於決策樹的貸款審批模型 一 背景描述 銀行信貸業務是銀行最基本 最重要的資產業務,通過發放銀行貸款收回本金和利息,扣除成本後獲得利潤。銀行為了獲得更大的利潤,對每一位顧客的資訊進行分類,然後針對不同的顧客採用不同的方案。銀行每天要收到大量貸款申請,其中夾雜著大量不具備貸款資格的申請,為緩解審批人員...