本篇不講演算法
只講用python (pandas, matplotlib, numpy, sklearn) 進行訓練的一些要點
1.合併index
np.concatenate([index1,index2])
2.from sklearn.cross_validation import train_test_split
train_test_split(x, y, test_size = 0.3, random_state = 0) 一般要指定切分比例
返回x_train, x_test, y_train, y_test
做樣本劃分用的
3.接下來看看具體怎麼訓練模型
from sklearn.linear_model import logisticregression
from sklearn.cross_validation(現在應該是model_selection,版本更新了) import kfold, cross_val_score
from sklearn.metrics import confusion_matrix, recall_score, classification_report
所以總的來說沒有一步一步**寫的必要,這裡也就不寫了。
總結一下,主要有以下幾個操作:
1.train_test_split劃分資料集
2.kfold建立交叉驗證
3.recall_score 和 cross_val_score 的使用
4.把資料填進合適的模型
邏輯回歸模型 SAS邏輯回歸模型訓練
邏輯回歸模型是金融信貸行業製作各類評分卡模型的核心,幾乎80 的機器學習 統計學習模型演算法都是邏輯回歸模型,按照邏輯美國金融公司總結的sas建模過程,大致總結如下 一般通用模型訓練過程 a 按照指定需求和模型要求製作driver資料集,包含欄位有user id,dep b 其中,空值賦預設值即 c...
機器回歸 儲存模型,載入模型,邏輯回歸
from sklearn.externals import joblib 1.儲存jobib.dump rf,test.plk sgd sgdregressor sgd.fit x train,y train print sgd.coef 儲存訓練好的模型 joblib.dump sgd,tmp t...
機器學習 邏輯回歸
邏輯回歸 線性回歸的式子,作為邏輯回歸的輸入 適用場景 二分類 線性回歸的輸入 sigmoid函式 分類 0,1 概率值 計算公式 當目標值為1時 損失函式的變化 當目標值為0時 損失函式的變化 下面用乙個例項來說明邏輯回歸的用法 癌症概率 部分資料的截圖如下 資料描述 699條樣本,供11列資料,...