from sklearn.externals import joblib1.儲存jobib.dump(rf,『test.plk』)
sgd = sgdregressor(
) sgd.fit(x_train, y_train)
print
(sgd.coef_)
# 儲存訓練好的模型
joblib.dump(sgd,
'./tmp/test.pkl'
)
2.載入estimator = joblib.load(『test.plk』)
modle = joblib.load(
'./tmp/test.pkl'
) y_predict = std_y.inverse_transform(modle.predict(x_test)
)print
('儲存模型****:'
,y_predict)
解決2分類問題:
線性回歸的式子作為輸入:通過sigmoid函式
均方誤差:不存在多個區域性最低點,只有乙個最小值,
對數似然損失:多個區域性最小值1.哪個類別少,判定概率值就選這個淨量改變:1.多次隨機初始化,多次比較最小值結果
2.求解過程中,調整學習率
import pandas as pd
import numpy as np
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import standardscaler
from sklearn.linear_model import logisticregression
deflogistic()
:"""
retrun:邏輯回歸做二分類問題**
"""column =
['sample code number'
,'clump thickness'
,'uniformity of cell size'
,'uniformity of cell shape'
,'marginal adhesion'
,'single epithelial cell size'
,'bare nuclei'
,'bland chromatin'
,'normal nucleoli'
,'mitoses'
,'class'
] data = pd.read_csv(
'./bate/21.csv'
, names=column)
# print(data)
# 缺失值進行處理
data = data.replace(to_replace=
'?', value=np.nan)
# 用到了np函式的替換
# 缺失值用,把控制刪除
data = data.dropna(
)# 進行資料分割
x_train, x_test, y_train, y_test = train_test_split(data[column[1:
10]], data[column[10]
], test_size=
0.25
)# from sklearn.model_selection import train_test_split
# 進行標準化
std = standardscaler(
)# from sklearn.preprocessing import standardscaler
x_train = std.fit_transform(x_train)
x_test = std.transform(x_test)
# 邏輯回歸**
lg = logisticregression(c=
1.0)
# from sklearn.linear_model import logisticregression
lg.fit(x_train, y_train)
# 不斷優化w值
print
(lg.coef_)
# 權重引數,9個特徵的係數
print
("準確率:"
,lg.score(x_test, y_test)
) y_predict = lg.predict(x_test)
print
('&'*50
)print
('召回率:'
,classification_report(y_test, y_predict, labels=[2
,4], target_names=
["良性"
,"惡性"])
)# 目標值 2代表良性
return
none
if __name__==
'__main__'
: logistic(
)
邏輯回歸模型 SAS邏輯回歸模型訓練
邏輯回歸模型是金融信貸行業製作各類評分卡模型的核心,幾乎80 的機器學習 統計學習模型演算法都是邏輯回歸模型,按照邏輯美國金融公司總結的sas建模過程,大致總結如下 一般通用模型訓練過程 a 按照指定需求和模型要求製作driver資料集,包含欄位有user id,dep b 其中,空值賦預設值即 c...
機器學習 儲存模型 載入模型 Joblib
joblib描述 joblib是一組用於在python中提供輕量級流水線的工具。特點 透明的磁碟快取功能和懶惰的重新評估 memoize模式 簡單的平行計算 joblib可以將模型儲存到磁碟並可在必要時重新執行 實現 載入模組 from sklearn.datasets import load ir...
機器學習(四)邏輯回歸模型訓練
本篇不講演算法 只講用python pandas,matplotlib,numpy,sklearn 進行訓練的一些要點 1.合併index np.concatenate index1,index2 2.from sklearn.cross validation import train test s...