機器學習全套教程(十) 模型選擇與調優

2021-09-13 02:30:23 字數 890 閱讀 5010

python爬蟲人工智慧教程:www.python88.cn

程式設計資源網:www.python66.cn

應用

交叉驗證目的:為了讓被評估的模型更加準確可信

交叉驗證:將拿到的訓練資料,分為訓練和驗證集。以下圖為例:將資料分成5份,其中乙份作為驗證集。然後經過5次(組)的測試,每次都更換不同的驗證集。即得到5組模型的結果,取平均值作為最終結果。又稱5折交叉驗證。

我們之前知道資料分為訓練集和測試集,但是為了讓從訓練得到模型結果更加準確。做以下處理

通常情況下,有很多引數是需要手動指定的(如k-近鄰演算法中的k值),這種叫超引數。但是手動過程繁雜,所以需要對模型預設幾種超引數組合。每組超引數都採用交叉驗證來進行評估。最後選出最優引數組合建立模型。

# 使用網格搜尋和交叉驗證找到合適的引數

knn = kneighborsclassifier()

param =

gc = gridsearchcv(knn, param_grid=param, cv=2)

gc.fit(x_train, y_train)

print("選擇了某個模型測試集當中**的準確率為:", gc.score(x_test, y_test))

# 訓練驗證集的結果

print("在交叉驗證當中驗證的最好結果:", gc.best_score_)

print("gc選擇了的模型k值是:", gc.best_estimator_)

print("每次交叉驗證的結果為:", gc.cv_results_)

機器學習之模型選擇與調優

交叉驗證 將拿到的訓練資料,分為訓練和驗證集。以下圖為例 將資料分成5份,其中乙份作為驗證集。然後經過5次 組 的測試,每次都更換不同的驗證集。即得到5組模型的結果,取平均值作為最終結果。又稱5折交叉驗證。五折交叉驗證,就是分成5份,三份訓練,乙份驗證,乙份測試 我們之前知道資料分為訓練集和測試集,...

20191203 機器學習複習 模型選擇與調優

模型選擇與調優 在knn演算法中,k的選擇是乙個重要的問題 那麼有沒有一種辦法能選擇準確的k值 模型選擇與調優可以實現 什麼是交叉驗證 交叉驗證 我們拿到的訓練資料,分為訓練集和驗證集。將資料分為4份,其中乙份作為驗證集,然後經過4組的測試,每次都更換不同的驗證集,即得到4組的結果,取平均值作為最終...

機器學習之模型的選擇與調優

交叉驗證 將拿到的資料,分為訓練和驗證集。以下圖為例 將資料分成4份,其中乙份作為驗證集。然後經過4次 組 的測試,每次都更換不同的驗證集。即得到4組模型的結果,取平均值作為最終結果。又稱4折交叉驗證。通常情況下,有很多引數是需要手動指定的 如k 近鄰演算法中的k值 這種叫超引數。但是手動過程繁雜,...