建模模型超引數調參筆記1

超引數調參，一種方法是用gridsearchcv，grid_search = gridsearchcv(clf,param_grid,n_jobs=-1,verbose=2)

clf 是要使用的模型，param_grid 指要調整的超引數，用字典表示，n_jobs 指用電腦的cpu個數，-1代表全部都用，verbose 指cv表示輸出形式。

拿著grid_search 就可以去fit 訓練集了。訓練好之後，可以用clf = grid_search.best_estimator_ 表示最優超引數對應的估計器。然後就可以調整超引數為最優狀態的估計器去**目標值了 y_pre = clf.predict(x_test)。最後再用clf.score(x_test,y_pre) 檢視下模型的準確率。

總結一下目前掌握的建模流程：

1、預處理

2、選擇模型

3、調整模型的超引數

4、**

preprocessing...

select model, eg.clf...

grid_search = gridsearchcv(clf, param_grid, n_job=-2, verbos=2) #建立模型的網格搜尋例項

grid_search.fit(x_train, y_train) #用訓練集進行擬合，調整超引數和模型

grid_search.best_params_ #會返回param_grid裡設定的超引數的最優值，也會返回對應的準確率

clf = grid_search.best_estimator_ #最優超引數對應的估計器

y_pre = clf.predict(x_test) #拿最優估計器進行**

clf.score(x_test, y_pre) #檢視**的準確率

模型引數超參（28）

模型引數需要在訓練資料上通過某種演算法方式找出來的特徵引數，也就是需要訓練的引數，eg 線性回歸中的值超引數在模型訓練過程中演算法需要使用到的引數值，這個引數值會影響最終模型引數的求解，所以需要開發人員給定，比如 ridge演算法中的正則化項係數alpha引數給定方式 1.可以根據演算法的...

模型評估之超引數調優

百面機器學習通過查詢搜尋範圍內的所有的點來確定最優值。這種搜尋方案十分消耗計算資源和時間。在實際應用中，一般先使用較廣的搜尋範圍和較大的步長，來尋找全域性最優值可能的位置然後會逐漸縮小搜尋範圍和步長，來尋找更精確的最優值。但由於目標函式一般都是非凸的，所以很可能會錯過全域性最優值。與網格搜尋類似...

整合學習筆記04 模型評估與超引數調優

引數與超引數模型引數是模型內部的配置變數，其值可以根據資料進行估計。進行時需要引數。它引數定義了可使用的模型。引數是從資料估計或獲悉的。引數通常不由程式設計者手動設定。引數通常被儲存為學習模型的一部分。引數是機器學習演算法的關鍵，它們通常由過去的訓練資料中總結得出模型超引數是模型外部的配置，其...

建模 模型超引數調參筆記1

模型引數 超參（28）

模型評估之超引數調優

整合學習筆記04 模型評估與超引數調優

相關推薦

建模模型超引數調參筆記1

模型引數超參（28）