平均絕對誤差mae(mean absolute error
) 和均方根誤差 rmse(root mean squared error
)是衡量變數精度的兩個最常用的指標,同時也是機器學習中評價模型的兩把重要標尺。
那兩者之間的差異在**?它對我們的生活有什麼啟示?
平均絕對誤差mae(mean absolute error
)是絕對誤差的平均值,它其實是更一般形式的誤差平均值。
因為如果誤差是[-1,0,1],平均值就是0,但這並不意味之系統不存在誤差,只是正負相互抵消了,因此我們要加上絕對值。它的定義表示式為:
換成更直接的表示式:
而均方根誤差 rmse(root mean squared error
),也有資料稱為rmsd
,也可以測量誤差的平均大小,它是**值和實際觀測之間平方差異平均值的平方根。
它的定義為:
換成更直接的表示式為:
只是看這些抽象的公式,很難幫我們理解它們之間的差異,讓我們來用乙個實際的例子說明:
那麼我們來計算兩個序列的平均絕對誤差mae和均方根誤差rmse。
我們計算得出:
對於第乙個月:平均絕對誤差 mae1 = 62.5分鐘,均方根誤差 rmse1:235.82 分鐘
對於第二個月:平均絕對誤差 mae2 = 7.5分鐘,均方根誤差rmse2 = 7.91分鐘
第乙個月的平均絕對誤差 mae(62.5) 與均方根誤差 rmse(235.82) 之比接近1:4,
第二個月遲到時間的平均絕對誤差 mae (7.5) 與均方根誤差 rmse(7.91)之比約為1:1。
我們應該用哪個量衡量女朋友守時呢?
我們看到均方根誤差 rmse 受異常值的影響更大。
如果我們去評判女朋友守時方面的進步,用rmse標準,我們更可以看到她的進步之大,也許更要獎勵她一頓饕餮盛宴。
一般來說,我們應該期望 mae 值比 rmse 值小得多。
因為對於均方根誤差rmse,每個誤差都是平方的。
這意味著單個誤差呈二次增長,並且對最終rmse值有不同的影響。
這兩組誤差序列之間的惟一區別是序列1中的極值是1000,而不是10。
因此,我們看到較大的異常值對均方根誤差rmse的影響更大。
當我們處理較大的資料集時,我們不能檢查每個值以了解是否有乙個或一些異常值,或者是否所有的錯誤都系統性地更高。
檢視 mae 和 rmse 的比值可以幫助我們理解是否存在較大但不常見的錯誤。
另外,在生活中,如果想準確的衡量乙個人的進步有多大,以便造就和堅固ta的進步,你知道應該選擇哪一副眼鏡去看待了麼?
深度學習中相關概念詳解
神經網路中的偏置值什麼意思?就是b值.wx b的b,打個比方 有點 1,1 屬於1類 點 2,2 屬於2類,請問是否能從原點畫一條線把他們分開,不可以,所以需要偏置值b,這樣線段就不從 0,0 點出發了。分類與回歸的區別是什麼?分類和回歸的區別在於輸出變數的型別。定量輸出稱為回歸,或者說是連續變數 ...
深度學習之優化演算法詳解
梯度下降 batch gradient descent,stochastic gradientdescent,以及 mini batchgradient descent 現在的 sgd一般都指 mini batch gradient descent sgd就是每一次迭代計算 mini batch 的...
深度學習之啟用函式詳解
啟用函式是什麼 啟用函式,即activation function,有時候也稱作激勵函式。它是為了解決線性不可分的問題引出的。但是也不是說線性可分就不能用啟用函式,也是可以的。它的目的是為了使資料更好的展現出我們想要的效果。啟用函式在 用?比如乙個神經網路 為了更清晰的表示,我用紅色標出。比如像上面...