使用者指南監督學習 1 3 核心嶺回歸

核心嶺回歸(kernel ridge regression-krr) 由使用核心方法的嶺回歸(使用l2正則化的最小二乘法)所組成。因此，它所擬合到的在空間中不同的線性函式是由不同的核心和資料所導致的。對於非線性的核心，它與原始空間中的非線性函式相對應。

由kernelridge學習的模型的形式與支援向量回歸(svr是一樣的。但是他們使用不同的損失函式: 核心嶺回歸(krr)使用平方誤差損失函式(squared error loss) 而支援向量回歸(support vector regression)(svr)使用 ε

\varepsilon

ε-insensitive loss ( ε

\varepsilon

ε-不敏感損失 )，兩者都使用l2正則化。與svr相反，擬合kernelridge可以以封閉形式(closed-form) 完成，對於中型資料集通常更快。另一方面，學習的模型是非稀疏的，因此比svr慢。在**時間內，svr擬合的是 ε

0\varepsilon>0

ε>

0 的稀疏模型。

下圖比較了人造資料集上的kernelridge和svr的區別，它由乙個正弦目標函式和每五個資料點產生乙個強雜訊組成。圖中分別繪製了由kernelridge和svr學習到的回歸曲線。兩者都使用網格搜尋優化了rbf核心的複雜性/正則化(complexity/regularization )和頻寬(bandwidth)。它們的學習函式(learned functions) 非常相似；但是，擬合kernelridge大約比擬合svr快七倍(都使用網格搜尋(grid-search))。然而，由於svr只學習了乙個稀疏模型，所以svr** 10 萬個目標值比使用kernelridge快三倍以上。svr只使用了大約 1/3 的資料點做為支撐向量。

下圖顯示不同大小訓練集的kernelridge和svr的擬合(fitting)和**(prediction) 時間。對於中型訓練集(小於 1000 個樣本)，擬合kernelridge比svr快；然而，對於更大的訓練集svr通常更好。關於**時間，由於學習的稀疏解，svr對於所有不同大小的訓練集都比kernelridge快。注意，稀疏度和**時間取決於svr的引數 ε

\varepsilon

ε 和 c;ε

=0c;\varepsilon=0

c;ε=

0 將對應於密集模型。

示例: 核心嶺回歸與svr的對比

參考: 「machine learning: a probabilistic perspective」 murphy, k. p. - chapter 14.4.3, pp. 492-493, the mit press, 2012

使用者指南監督學習 1 3 核心嶺回歸

機器學習監督學習（回歸）嶺回歸

線性回歸監督學習

監督學習1 線性回歸

使用者指南 監督學習 1 3 核心嶺回歸

機器學習 監督學習 （回歸）嶺回歸

線性回歸 監督學習

監督學習1 線性回歸

相關推薦

使用者指南監督學習 1 3 核心嶺回歸

機器學習監督學習（回歸）嶺回歸

線性回歸監督學習