支援向量機是建立在統計學習理論基礎之上的新一代機器學習演算法,支援向量機的優勢主要體現在解決線性不可分問題,它通過引入核函式,巧妙地解決了在高維空間中的內積運算,從而很好地解決了非線性分類問題。
構造出乙個具有良好效能的svm,核函式的選擇是關鍵.核函式的選擇包括兩部分工作:一是核函式型別的選擇,二是確定核函式型別後相關引數的選擇.因此如何根據具體的資料選擇恰當的核函式是svm應用領域遇到的乙個重大難題,也成為科研工作者所關注的焦點,即便如此,卻依然沒有得到具體的理論或方法來指導核函式的選取.
1、經常使用的核函式
核函式的定義並不困難,根據泛函的有關理論,只要一種函式k(
xi,x
j)滿足mercer條件,它就對應某一變換空間的內積.對於判斷哪些函式是核函式到目前為止也取得了重要的突破,得到mercer定理和以下常用的核函式型別:
(1)線性核函式k
(x,x
i)=x
⋅xi
(2)多項式核k
(x,x
i)=(
(x⋅x
i)+1
)d
(3)徑向基核(rbf)k
(x,x
i)=exp(−
∥x−x
i∥2σ
2)
gauss徑向基函式則是區域性性強的核函式,其外推能力隨著引數
σ 的增大而減弱。多項式形式的核函式具有良好的全域性性質。區域性性較差。
(4)傅利葉核k
(x,x
i)=1
−q22
(1−2
qcos(x
−xi)
+q2)
(5)樣條核k
(x,x
i)=b
2n+1
(x−x
i)
(6)sigmoid核函式k
(x,x
i)=tanh(κ
(x,x
i)−δ
) 採用sigmoid函式作為核函式時,支援向量機實現的就是一種多層感知器神經網路,應用svm方法,隱含層節點數目(它確定神經網路的結構)、隱含層節點對輸入節點的權值都是在設計(訓練)的過程中自動確定的。而且支援向量機的理論基礎決定了它最終求得的是全域性最優值而不是區域性最小值,也保證了它對於未知樣本的良好泛化能力而不會出現過學習現象。
2、核函式的選擇
在選取核函式解決實際問題時,通常採用的方法有:一是利用專家的先驗知識預先選定核函式;二是採用cross-validation方法,即在進行核函式選取時,分別試用不同的核函式,歸納誤差最小的核函式就是最好的核函式.如針對傅利葉核、rbf核,結合訊號處理問題中的函式回歸問題,通過**實驗,對比分析了在相同資料條件下,採用傅利葉核的svm要比採用rbf核
的svm誤差小很多.三是採用由smits等人提出的混合核函式方法,該方法較之前兩者是目前選取核函式的主流方法,也是關於如何構造核函式的又一開創性的工作.將不同的核函式結合起來後會有更好的特性,這是混合核函式方法的基本思想.
對於核函式的理解,pluskid的部落格寫的相當不錯啊,大家可以看看。
SVM的常見核函式及其選取
核函式的數學要求 核函式有嚴格的數學要求,所以設計乙個核函式是很困難的。k x,z 是正定核的充要條件是 k x,z 對應的gram矩陣實半正定矩陣。gram矩陣 矩陣對應點的內積。ktk,kkt 半正定矩陣 設a是實對稱矩陣。如果對任意的實非零列矩陣x有xtax 0,就稱a為半正定矩陣。當檢驗乙個...
python高斯核函式運用 高斯核函式
在計算機視覺中,有時也簡稱為高斯函式。高斯函式具有五個重要的性質,這些性質使得它在早期影象處理中特別有用.這些性質表明,高斯平滑濾波器無論在空間域還是在頻率域都是十分有效的低通濾波器,且在實際影象處理中得到了工程人員的有效使用.高斯函式具有五個十分重要的性質,它們是 1 二維高斯函式具有旋轉對稱性,...
核函式如何
linear核 主要用於線性可分的情形。引數少,速度快,對於一般資料,分類效果已經很理想了。rbf核 主要用於線性不可分的情形。引數多,分類結果非常依賴於引數。有很多人是通過訓練資料的交叉驗證來尋找合適的引數,不過這個過程比較耗時。我個人的體會是 使用libsvm,預設引數,rbf核比linear核...