關於訓練誤差 測試誤差 泛化誤差

2021-09-14 02:49:27 字數 697 閱讀 9311

我們在學習模式識別的時候,總是會遇到一些專業詞彙,而其中有的專業詞彙叫人傻傻分不清。

今天我就來說說訓練誤差、測試誤差、泛化誤差到底是什麼,區別所在。

對於分類學習演算法,我們一般將樣本集分為訓練集和測試集,其中訓練集用於演算法模型的學習或訓練,而測試集通常用於評估訓練好的模型對於資料的**效能評估。而這個先後順序就是先將演算法在訓練集上訓練得到乙個模型,然後在測試集上評估效能。

這個時候我們通常要考慮評估的這個效能是否合理。由於測試學習演算法是否成功在於演算法對於訓練中未見過的資料的**執行能力,因此我們一般將分類模型的誤差分為訓練誤差(training error)和泛化誤差(generalization error)。那麼這兩個誤差到底是什麼呢?

訓練誤差是指模型在訓練集上的錯分樣本比率,說白了就是在訓練集上訓練完畢後在訓練集本身上進行**得到了錯分率

(同樣的測試誤差就是模型在測試集上的錯分率)

泛化誤差是指模型在未知記錄上的期望誤差,說白了就是在訓練集上沒見過的資料的錯分樣本比率。

因此在樣本集劃分時,如果得到的訓練集與測試集的資料沒有交集,此時測試誤差基本等同於泛化誤差。

因此以上就是三者的意義所在和區別所在!!

偏差,方差,訓練誤差,測試誤差的區別

偏差 就是 值的期望離所有被 的樣本的真實值的 距離的期望。刻畫了學習演算法本身的擬合能力。方差 就是 值的期望離所有被 的樣本的 值的 距離的期望。刻畫了資料擾動所造成的影響。值的期望就好像測試集所有點的中心。注意 當我們確定乙個模型時,可以通過比較偏差,方差情況看看,我們是最大我們的訓練長度還是...

名詞解析之泛化誤差

摘要 以前在機器學習中一直使用經驗風險來逼近真實風險,但是事實上大多數情況經驗風險並不能夠準確逼近真實風險。後來業界就提出了泛化誤差的概念 generalization error 在機器學習中泛化誤差是用來衡量乙個學習機器推廣未知資料的能力,即根據從樣本資料中學習到的規則能夠應用到新資料的能力。常...

名詞解析之泛化誤差

摘要 以前在機器學習中一直使用經驗風險來逼近真實風險,但是事實上大多數情況經驗風險並不能夠準確逼近真實風險。後來業界就提出了泛化誤差的概念 generalization error 在機器學習中泛化誤差是用來衡量乙個學習機器推廣未知資料的能力,即根據從樣本資料中學習到的規則能夠應用到新資料的能力。常...