小菜君的SVM筆記之核方法與核函式

前面對非線性支援向量機進行了簡單的介紹。例如moons資料集，為其增加乙個維度，即可很容易地構造乙個平面對兩類樣本進行分割。然而，若對映至3維空間無法較好分割則需要對映到更高維空間，尤其是當原始資料維度較高時，可能需要將其對映到無窮維空間，這根本無法計算。

首先，給出核函式的定義。

定義：設x

\mathcal

x是輸入空間，為歐氏空間r

n\mathbb^n

rn及其子空間或離散的幾何，又設h

\mathcal

h為特徵空間，為希爾伯特空間，若存在乙個從x

\mathcal

x到h\mathcal

h的對映ϕ(x

):x→

h\phi(\boldsymbol):\ \mathcal \rightarrow \mathcal

ϕ(x):x

→h使得對所有的x,z

∈x\boldsymbol,\boldsymbol\in \mathcal

x,z∈

x函式k(x

,z)k(\boldsymbol,\boldsymbol)

k(x,z)

滿足條件k(x

,z)=

ϕ(x)

⋅ϕ(z

)k(\boldsymbol,\boldsymbol) = \phi(\boldsymbol)\cdot \phi(\boldsymbol)

k(x,z)

=ϕ(x

)⋅ϕ(

z)則稱k (x

,z)k(\boldsymbol,\boldsymbol)

k(x,z)

為核函式，ϕ(x

)\phi(\boldsymbol)

ϕ(x)

為對映函式，而ϕ(x

)⋅ϕ(

z)\phi(\boldsymbol)\cdot \phi(\boldsymbol)

ϕ(x)⋅ϕ

(z)稱為ϕ(x

)\phi(\boldsymbol)

ϕ(x)

和ϕ (z

)\phi(\boldsymbol)

ϕ(z)

的內積。

正如之前在對偶問題的求解和smo演算法中，將x⊤x

\boldsymbol\boldsymbol

x⊤x寫成內積的形式，即用核函式進行代替。通過核函式，我們並不需要顯式地定義原始空間到特徵空間的對映，僅通過定義核函式就可以在原始空間中進行計算，再通過內積體現在高維的特徵空間當中，避免了在高維空間中進行複雜的計算。

然而，乙個函式是否是核函式是有條件的，我們往往要求其是正定核函式（因為此時才能夠保證特徵空間的存在）。我們需要去找正定核函式的充要條件。

定理:設k:x

×x→r

k: \mathcal \times \mathcal \rightarrow \mathbb

k:x×x→

r是對稱函式，則k(x

,z)k(\boldsymbol, \boldsymbol)

k(x,z)

是正定核函式的充要條件是對任意xi∈

x,i∈

[m]\boldsymbol \in \mathcal, i \in [m]

xi∈x,

i∈[m

]，k(x,

z)k(\boldsymbol, \boldsymbol)

k(x,z)

對應的gram矩陣k=[

k(xi

,xj)

]m×m

k = \left[ k(\boldsymbol,\boldsymbol)\right]_

k=[k(x

i,x

j)]

m×m

是半正定矩陣。

在此不做證明，可參考李航老師《統計學習方法》中的證明。實際應用中我們往往是直接應用已有的函式。下面對常見的核函式進行介紹。

小菜君的SVM筆記之核方法與核函式

SVM學習筆記4 核函式和離群點的處理

SVM學習筆記4 核函式和離群點的處理

機器學習之SVM（粗略的筆記）

小菜君的SVM筆記之核方法與核函式

SVM學習筆記4 核函式和離群點的處理

SVM學習筆記4 核函式和離群點的處理

機器學習之SVM（粗略的筆記）

相關推薦