在機器學習中常常會用到將訓練好的模型儲存,以便於在使用時不用再次訓練資料,就可以直接使用訓練好的模型。
以sklearn中隨機森林分類為例
> #載入資料集
from sklearn.datasets import load_breast_cancer
import pandas as pd
from sklearn.ensemble import randomforestclassifier
from sklearn.externals import joblib
df = load_breast_cancer()
#將資料轉化為dataframe
df_y = pd.dataframe(df.target)
df = pd.dataframe(df.data, columns=df.feature_names)
df['y'] = df_y
#資料分割,將資料的後百分之20作為測試集
df_train = df.values[:-(df.shape[0]//5), :]
df_test = df.values[-(df.shape[0]//5):, :]
x_train = df_train[:, :-1]
y_train = df_train[:, -1]
x_test = df_test[:, :-1]
y_test = df_test[:, -1]
#隨機森林模型
path = "d:/學習任務/第二週/分類/隨機森林/randomforestclassifiter.model"
model = randomforestclassifier(n_estimators=100, max_depth=none, min_samples_split=2, max_leaf_nodes=none)
model.fit(x_train, y_train)
y_pred = model.predict(x_test)
#模型儲存
joblib.dump(model, path)
path = "d:/學習任務/第二週/分類/隨機森林/randomforestclassifiter.model"
model = joblib.load(path)
這樣就把剛剛訓練好的模型調出來了,可以用來對新資料的分類處理。 機器學習模型儲存
在訓練完成機器學習模型後,經常將滿足需要的機器學習模型進行儲存,本文以svm演算法為例,講解模型儲存和呼叫的方法。joblib.dump 模型,模型命名 將訓練模型儲存起來如 from sklearn.svm import svc from sklearn.metrics import classi...
機器學習 模型儲存
目錄 pickle模組 sklearn joblib模組 hive分割槽表 在訓練模型後將模型儲存的方法,以免下次重複訓練。以及大資料裡直接將bi模型結果儲存在hive表裡。from sklearn import svm from sklearn import datasets import pic...
機器學習 Python模型的儲存與讀取
在學習機器學習的過程中,很多人都應該有這樣的疑問 模型訓練好了,以後要用怎麼辦呢?肯定不能再跑一邊資料,重新訓練模型以供使用,因為這樣太費時間。最好的辦法當然是,訓練和 分開。訓練好模型後,將模型儲存好,當需要 時,直接讀取模型檔案來呼叫,進行 無論是sklearn還是tensorflow,都有模型...