機器學習全套教程（十）模型選擇與調優

2021-09-13 02:30:23 字數 890 閱讀 5010

python爬蟲人工智慧教程：www.python88.cn

程式設計資源網：www.python66.cn

應用

交叉驗證目的：為了讓被評估的模型更加準確可信

交叉驗證：將拿到的訓練資料，分為訓練和驗證集。以下圖為例：將資料分成5份，其中乙份作為驗證集。然後經過5次(組)的測試，每次都更換不同的驗證集。即得到5組模型的結果，取平均值作為最終結果。又稱5折交叉驗證。

我們之前知道資料分為訓練集和測試集，但是為了讓從訓練得到模型結果更加準確。做以下處理

通常情況下，有很多引數是需要手動指定的（如k-近鄰演算法中的k值），這種叫超引數。但是手動過程繁雜，所以需要對模型預設幾種超引數組合。每組超引數都採用交叉驗證來進行評估。最後選出最優引數組合建立模型。

# 使用網格搜尋和交叉驗證找到合適的引數
knn = kneighborsclassifier()
param = 
gc = gridsearchcv(knn, param_grid=param, cv=2)
gc.fit(x_train, y_train)
print("選擇了某個模型測試集當中**的準確率為：", gc.score(x_test, y_test))
# 訓練驗證集的結果
print("在交叉驗證當中驗證的最好結果：", gc.best_score_)
print("gc選擇了的模型k值是：", gc.best_estimator_)
print("每次交叉驗證的結果為：", gc.cv_results_)

機器學習之模型選擇與調優

交叉驗證將拿到的訓練資料，分為訓練和驗證集。以下圖為例將資料分成5份，其中乙份作為驗證集。然後經過5次組的測試，每次都更換不同的驗證集。即得到5組模型的結果，取平均值作為最終結果。又稱5折交叉驗證。五折交叉驗證，就是分成5份，三份訓練，乙份驗證，乙份測試我們之前知道資料分為訓練集和測試集，...

20191203 機器學習複習模型選擇與調優

模型選擇與調優在knn演算法中，k的選擇是乙個重要的問題那麼有沒有一種辦法能選擇準確的k值模型選擇與調優可以實現什麼是交叉驗證交叉驗證我們拿到的訓練資料，分為訓練集和驗證集。將資料分為4份，其中乙份作為驗證集，然後經過4組的測試，每次都更換不同的驗證集，即得到4組的結果，取平均值作為最終...

機器學習之模型的選擇與調優

交叉驗證將拿到的資料，分為訓練和驗證集。以下圖為例將資料分成4份，其中乙份作為驗證集。然後經過4次組的測試，每次都更換不同的驗證集。即得到4組模型的結果，取平均值作為最終結果。又稱4折交叉驗證。通常情況下，有很多引數是需要手動指定的如k 近鄰演算法中的k值這種叫超引數。但是手動過程繁雜，...