回歸問題的典型效能指標是均方根誤差(rmse),它測量的是**過程中,**錯誤的標準偏差(標準偏差是方差的算術平方根,而方差是離均平方差的平均數)。
例如,rmse等於50000就意味著,系統的**值中約68%落在50000美元之內,約95%落在100000美元之內(一種常見的特徵分布是呈鐘形態的分布,稱為正態分佈(也叫高斯分布),「68-95-99.7」的規則是指:大約68%的值落在1σ
\sigma
σ,95%落在2σ
\sigma
σ,99.7%落在3σ
\sigma
σ內)。
rmse的數學計算公式為rms
e(x,
h)=1
m∑i=
1m(h
(xi)
−yi)
2rmse(x,h)=\sqrt\sum_^m(h(x^)-y^)^2}
rmse(x
,h)=
m1i
=1∑m
(h(
xi)−
yi)2
即使rmse通常是回歸任務的首選效能衡量指標,但在某些情況下,其它函式可能會更適合。例如,當有很多離群區域時,你可以考慮使用平均絕對誤差(也稱為平均絕對偏差,公式如下所示)mae
(x,h
)=1m
∑i=1
m∣h(
xi)−
yi
∣mae(x,h)=\frac\sum_^m|h(x^)-y^|
mae(x,
h)=m
1i=
1∑m
∣h(x
i)−y
i∣均方根誤差和平均絕對誤差兩種方法都是測量兩個向量之間的距離:**向量和目標值向量。距離或者範數的測度可能有多種:
機器學習 回歸問題(一)
首先,我們來看乙個例子。你有乙個朋友,他有一套750平方英呎的房子,他來問你能賣多少錢。然後,你就找來了附近房子的最近買賣資訊,然後把面積跟房價畫了一條曲線出來。注 例子與圖來自andrew ng的machine learning課程。如圖,我們知道的只是上面一些點,橫座標是面積,縱座標是房價。現在...
機器學習 線性回歸問題
案例分析 正規方程 梯度下降 嶺回歸 from sklearn.datasets import load boston from sklearn.linear model import linearregression,sgdregressor,ridge from sklearn.model se...
機器學習線性回歸 機器學習中的簡單線性回歸步驟
簡單線性回歸,這是一種基於自變數值 x 來 因變數值 y 的方法。假設這兩個變數是線性相關的。因此,我們嘗試尋找一種根據特徵或自變數 x 的線性函式來精確 響應值 y 我們將按照之前的資料預處理資訊圖表那樣來執行相同的步驟 其中第三相關庫matplotlib是用來視覺化資料的。匯入資料集 檢查缺失資...