在吳恩達機器學習課程的第86課時中,講解了偏差和方差與欠擬合和過擬合的關係。
1、偏差與方差的概念
先看下網上關於偏差與方差的例子。
該例子可以理解為射擊打靶。
偏差指的是多次射擊的平均環數與環心的偏差度,顯然上方的兩個圖的偏差較小,而下方兩圖偏離圓心較遠,偏差較大。
方差指的是多次射擊的成績穩定狀態,顯然左邊兩圖射擊點較為集中,其方差較小,右邊兩圖射擊點不怎麼集中,穩定性較差,其方差較大。
2、過擬合與欠擬合
分別使用1次、2次、4次多項式多資料集進行擬合,使用1次多項式進行擬合時,左圖為欠擬合狀態,使用4次多項式進行擬合時,右圖為過擬合狀態。
3、兩者之間的關係
當擬合多項式的次數較低時,擬合不太好,其為欠擬合狀態,訓練誤差為高偏差,此時訓練誤差和交叉驗證誤差均很高。
當擬合多項式的次數較高時,由於擬合得非常好,其為過擬合狀態,此時訓練誤差偏差度極低,由於其**的準確度很低,此時方差較高,為高方差狀態,訓練誤差和交叉驗證誤差均很高。
當正則化引數lambda很大時,其對引數theta的懲罰很重,會導致欠擬合狀態,此時為高偏差狀態,**不準確;
當正則化引數lambda較小時,其對引數thata的懲罰較輕,會導致過擬合狀態,此時**較為準確,但**不穩定,方差較大,為高方差狀態。
機器學習 偏差 方差與欠擬合 過擬合
首先,我們先來理解一下偏差與方差的概念。舉個高中數學裡經常出現的例子,兩個射擊選手在射靶。甲射出的子彈很集中在某個區域,但是都偏離了靶心。我們說他的射擊很穩定,但是不夠準,準確性差。也就是說他的方差小 子彈很集中在某個區域 但是他的偏差大 子彈打中的地方距離靶心遠 相反,乙射出的子彈比較分散,但是有...
吳恩達機器學習 過擬合問題
看到這篇文章的同學,我希望是已經學習了幾種不同的學習演算法,包括線性回歸和邏輯回歸,它們能夠有效地解決許多問題,但是當將它們應用到某些特定的機器學習應用時,會遇到過擬合 over fitting 的問題,可能會導致它們效果很差。如果我們有非常多的特徵,我們通過學習得到的假設可能能夠非常好地適應訓練集...
偏差與方差,欠擬合與過擬合的關係
偏差指 輸出與真實標記的差別,記為 偏差度量了學習演算法的期望 與真實結果的偏離程度,即刻畫了學習演算法本身的擬合能力。方差指乙個特定訓練集訓練得到的函式,與所有訓練集得到平均函式的差的平方再取期望,記為 方差度量了同樣大小的訓練集的變動所導致的學習效能的變化,即刻畫了資料擾動所造成的影響。方差表示...