DL筆記防止模型過擬合的處理方法（更新中）

前言

過擬合可以通俗理解為模型學習到了訓練資料幾乎全部的特徵，對於訓練集具有非常高的準確率，但對於測試集的特徵敏感，往往不能再測試集中取得較高準確率，這種現象主要是由於在訓練過程中，為了使模型學到更多的特徵，從而增加模型的複雜程度，使模型更加依賴訓練集，而泛化能力較弱。

如上圖所示，過擬合會給模型帶來很不好的影響，對於乙個模型，不斷增加引數提公升模型的複雜程度，起初error會下降，隨後便上公升，拐點之後就發生了過擬合，由於模型過於複雜，對未知資料的擬合性較差。

過擬合經常存在於機器學習模型中，尤其是深度學習模型中，由於深度學習模型網路結構較深，有此帶來的過擬合也相當嚴重。在深度學習模型中，常用到以下幾種方法來處理過擬合問題。

資料增強在alexnet模型中就有使用，在vgg**中更是以大篇幅進行對比分析，其思想比較簡單，通過增加資料量來提高模型的泛化能力，從而防止過擬合，這種方法在計算機視覺領域應用最多，實現方式為裁剪、縮放、翻轉等操作，比如輸入大小為256x256，隨機裁剪為224x224的，在畫素的角度，一張就可以得到很多張裁剪，這樣便大大擴充了資料集。資料增強不像bn、正則這些方法有很多數學推導，它使用且簡單。

對模型進行訓練的過程即是對模型的引數進行學習更新的過程，這個引數學習的過程往往會用到一些迭代方法，如梯度下降（gradient descent）學習演算法。early stopping便是一種迭代次數截斷的方法來防止過擬合的方法，即在模型對訓練資料集迭代收斂之前停止迭代來防止過擬合。

early stopping方法的具體做法是，在每乙個epoch結束時（乙個epoch集為對所有的訓練資料的一輪遍歷）計算validation data的accuracy，當accuracy不再提高時，就停止訓練。這種做法很符合直觀感受，因為accurary都不再提高了，在繼續訓練也是無益的，只會提高訓練的時間。那麼該做法的乙個重點便是怎樣才認為validation accurary不再提高了呢？並不是說validation accuracy一降下來便認為不再提高了，因為可能經過這個epoch後，accuracy降低了，但是隨後的epoch又讓accuracy又上去了，所以不能根據一兩次的連續降低就判斷不再提高。一般的做法是，在訓練的過程中，記錄到目前為止最好的validation accuracy，當連續10次epoch（或者更多次）沒達到最佳accuracy時，則可以認為accuracy不再提高了。此時便可以停止迭代了（early stopping）。這種策略也稱為「no-improvement-in-n」，n即epoch的次數，可以根據實際情況取，如10、20、30……

DL筆記防止模型過擬合的處理方法（更新中）

怎樣模型防止過擬合

防止過擬合的方法

機器學習中防止過擬合的處理方法

DL筆記 防止模型過擬合的處理方法（更新中）

怎樣模型防止過擬合

防止過擬合的方法

機器學習中防止過擬合的處理方法

相關推薦

DL筆記防止模型過擬合的處理方法（更新中）