import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
#載入資料
churn=pd.read_csv(『w4_churn.csv』)
將資料集中的類別變數轉化為數字型變數
churn=pd.get_dummies(churn)
####檢視前5行資料
churn.head()
#資料整理,將churn_yes保留,將female保留,drop不需要的資料
churn.drop([『churn_no』,『gender_male』],axis=1,inplace=true)
#檢視資料
churn.head()
#統一大小寫
churn.columns=churn.columns.str.lower()
#修改欄位名
churn=churn.rename(columns=)
#檢視資料
churn.head()
#基於模型的結果,對訓練集與測試集中x的真實值**對應的y
y_pred_train=lr.predict(x_train)
y_pred_test=lr.predict(x_test)
print(y_pred_train)
#搭建訓練集混淆矩陣
import sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)
#計算訓練集準確率
metrics.accuracy_score(y_train,y_pred_train)
#搭建測試集混淆矩陣
metrics.confusion_matrix(y_test,y_pred_test)
#計算測試集準確率
metrics.accuracy_score(y_test,y_pred_test)
#載入資料切分工具包
from sklearn.model_selection import train_test_split
#切分訓練集和測試集
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.5,random_state=100)
#建模from sklearn import linear_model
lr=linear_model.logisticregression()
lr.fit(x_train,y_train)
#基於模型的結果,對訓練集與測試集中x的真實值**對應的y
y_pred_train=lr.predict(x_train)
y_pred_test=lr.predict(x_test)
print(y_pred_train)
#優化模型評估 計算準確率
#搭建測試集混淆矩陣
metrics.confusion_matrix(y_test,y_pred_test)
#計算測試集準確率
metrics.accuracy_score(y_test,y_pred_test)
#搭建訓練集混淆矩陣
import sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)
#計算訓練集準確率
metrics.accuracy_score(y_train,y_pred_train)
y=churn[『flag』]
x=churn[[『contract_month』,『internet_other』,『paymentelectronic』]]
#載入資料切分工具包
from sklearn.model_selection import train_test_split
#切分訓練集和測試集
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.5,random_state=100)
#建模from sklearn import linear_model
lr=linear_model.logisticregression()
lr.fit(x_train,y_train)
#基於模型的結果,對訓練集與測試集中x的真實值**對應的y
y_pred_train=lr.predict(x_train)
y_pred_test=lr.predict(x_test)
print(y_pred_train)
#優化模型評估 計算準確率
#搭建測試集混淆矩陣
metrics.confusion_matrix(y_test,y_pred_test)
#計算測試集準確率
metrics.accuracy_score(y_test,y_pred_test)
#搭建訓練集混淆矩陣
import sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)
#計算訓練集準確率
metrics.accuracy_score(y_train,y_pred_train)
邏輯回歸模型 SAS邏輯回歸模型訓練
邏輯回歸模型是金融信貸行業製作各類評分卡模型的核心,幾乎80 的機器學習 統計學習模型演算法都是邏輯回歸模型,按照邏輯美國金融公司總結的sas建模過程,大致總結如下 一般通用模型訓練過程 a 按照指定需求和模型要求製作driver資料集,包含欄位有user id,dep b 其中,空值賦預設值即 c...
線性模型 邏輯回歸
模型原型 class sklearn.linear model.logisticregression penalty l2 dual false,tol 0.0001,c 1.0,fit intercept true,intercept scaling 1,class weight none,ran...
邏輯回歸 LR模型
邏輯回歸演算法相信很多人都很熟悉,也算是我比較熟悉的演算法之一了,畢業 當時的專案就是用的這個演算法。這個演算法可能不想隨機森林 svm 神經網路 gbdt等分類演算法那麼複雜那麼高深的樣子,可是絕對不能小看這個演算法,因為它有幾個優點是那幾個演算法無法達到的,一是邏輯回歸的演算法已經比較成熟,較為...