機器學習筆記 核函式的作用簡介

2022-08-23 04:57:13 字數 1504 閱讀 9798

核函式這個東西並不只是在svm中得到應用,在很多範圍領域中都會得到應用。

在上學期上課的時候雖然提到了核函式,但是當時對 其並沒有乙個很好的理解。只知道這個可以作用在一些軟間隔上面會比較有用。今天趁著宿舍驗收,上網在知乎上看了乙個解釋,感覺非常精妙。

核函式的作用簡單的說就是由低維度空間向高維度空間作乙個對映,使原本線性不可分資料變得在高維度上變得可分,並找到這個分割函式(也並不是所有的線性不可分都能變成可分,能否可分一是要看資料,另一方面要看你找到的核函式是否合適)。

需要注意的是,隨著深入你會發現核函式並不是對映這麼簡單。

下面我把看到的這個回答複製一下。

下面這張圖位於第

一、二象限內。我們關注紅色的門,以及「北京四合院」這幾個字下面的紫色的字母。我們把紅色的門上的點看成是「+」資料,紫色字母上的點看成是「-」資料,它們的橫、縱座標是兩個特徵。顯然,在這個二維空間內,「+」「-」兩類資料不是線性可分的。

我們現在考慮核函式

是二維空間中的兩個點。

這個核函式對應著乙個二維空間到三維空間的對映,它的表示式是:

可以驗證,

在p這個對映下,原來二維空間中的圖在三維空間中的像是這個樣子:

(前後軸為x軸,左右軸為y軸,上下軸為z軸)

注意到綠色的平面可以完美地分割紅色和紫色,也就是說,兩類資料在三維空間中變成線性可分的了。

而三維中的這個判決邊界,再對映回二維空間中是這樣的:

這是一條雙曲線,它不是線性的。

如上面的例子所說,核函式的作用就是隱含著乙個從低維空間到高維空間的對映,而這個對映可以把低維空間中線性不可分的兩類點變成線性可分的。

當然,我舉的這個具體例子強烈地依賴於資料在原始空間中的位置。

事實中使用的核函式往往比這個例子複雜得多。它們對應的對映並不一定能夠顯式地表達出來;它們對映到的高維空間的維數也比我舉的例子(三維)高得多,甚至是無窮維的。這樣,就可以期待原來並不線性可分的兩類點變成線性可分的了。

在機器學習中常用的核函式,一般有這麼幾類,也就是libsvm中自帶的這幾類:

1) 線性:

4) sigmoid:

的情況。

在實用中,很多使用者都是盲目地試驗各種核函式,並掃瞄其中的引數,選擇效果最好的。至於什麼樣的核函式適用於什麼樣的問題,大多數人都不懂。很不幸,我也屬於這大多數人,所以如果有人對這個問題有理論性的理解,還請指教。

核函式要滿足的條件稱為mercer's condition。

由於我以應用svm為主,對它的理論並不很了解,就不闡述什麼了。

使用svm的很多人甚至都不知道這個條件,也不關心它;有些不滿足該條件的函式也被拿來當核函式用。

機器學習之核函式

建議看這個,中文的 這裡面會講解kernel 的基本概念,svm,lda,lr,pca等如何使用kernel版本 本文大致講解核函式的定義,限制,使用等 機器學習中,對於線性可分的情況研究的比較透徹,可以採用svm lr 感知機等成熟的機器學習模型,但是很多情況是我們希望我們的模型學習非線性的模型。...

機器學習 SVM(核函式 高斯核函式RBF)

1 格式 2 多項式核函式 對傳入的樣本資料點新增多項式項 新的樣本資料點進行點乘,返回點乘結果 一維特徵的樣本,兩種型別,分布如圖,線性不可分 為樣本新增乙個特徵 x2 使得樣本在二維平面內分布,此時樣本在 x 軸公升的分布位置不變 如圖,可以線性可分 3 優點 特點 一般將原始樣本變形,通常是將...

機器學習 SVM核函式的計算

在 機器學習 推導支援向量機svm二分類中,我們已經推導出線性核svm的對偶優化問題 j i i 12 i j i jd idjk xi tk x j i i 12 i j i jdi djk xi,x j su bjec tto idi 0,0 i c 在優化好 i 拉格朗日量後,我們得到的w和b...