建模 模型超引數調參筆記1

2021-09-29 09:43:44 字數 878 閱讀 3183

超引數調參,一種方法是用gridsearchcv,grid_search = gridsearchcv(clf,param_grid,n_jobs=-1,verbose=2)

clf 是要使用的模型,param_grid 指要調整的超引數,用字典表示,n_jobs 指用電腦的cpu個數,-1代表全部都用,verbose 指cv表示輸出形式。

拿著grid_search 就可以去fit 訓練集了。訓練好之後,可以用clf = grid_search.best_estimator_ 表示最優超引數對應的估計器。然後就可以調整超引數為最優狀態的估計器去**目標值了 y_pre = clf.predict(x_test)。最後再用clf.score(x_test,y_pre) 檢視下模型的準確率。

總結一下目前掌握的建模流程:

1、預處理

2、選擇模型

3、調整模型的超引數

4、**

preprocessing...

select model, eg.clf...

grid_search = gridsearchcv(clf, param_grid, n_job=-2, verbos=2)    #建立模型的網格搜尋例項

grid_search.fit(x_train, y_train)    #用訓練集進行擬合,調整超引數和模型

grid_search.best_params_    #會返回param_grid裡設定的超引數的最優值,也會返回對應的準確率

clf = grid_search.best_estimator_    #最優超引數對應的估計器

y_pre = clf.predict(x_test)    #拿最優估計器進行**

clf.score(x_test, y_pre)    #檢視**的準確率

模型引數 超參(28)

模型引數 需要在訓練資料上通過某種演算法方式找出來的特徵引數,也就是需要訓練的引數,eg 線性回歸中的 值 超引數 在模型訓練過程中演算法需要使用到的引數值,這個引數值會影響最終模型引數的求解,所以需要開發人員給定,比如 ridge演算法中的正則化項係數alpha引數 給定方式 1.可以根據演算法的...

模型評估之超引數調優

百面機器學習 通過查詢搜尋範圍內的所有的點來確定最優值。這種搜尋方案十分消耗計算資源和時間。在實際應用中,一般先使用較廣的搜尋範圍和較大的步長,來尋找全域性最優值可能的位置 然後會逐漸縮小搜尋範圍和步長,來尋找更精確的最優值。但由於目標函式一般都是非凸的,所以很可能會錯過全域性最優值。與網格搜尋類似...

整合學習筆記04 模型評估與超引數調優

引數與超引數 模型引數是模型內部的配置變數,其值可以根據資料進行估計。進行 時需要引數。它引數定義了可使用的模型。引數是從資料估計或獲悉的。引數通常不由程式設計者手動設定。引數通常被儲存為學習模型的一部分。引數是機器學習演算法的關鍵,它們通常由過去的訓練資料中總結得出 模型超引數是模型外部的配置,其...