上一節我們講述了間隔公式是如何得到的,這一節講述要得到最大間隔時的分割超平面所要的條件是什麼。
在上圖中我們可以看到間隔為marginb/2,但是我們很容易發現黑線還可以向上移動從而得到更大的間隔,當移動到是最上面紅線與第乙個men資料點相交時便得到最大間隔了,如下圖:
下面我們就根據這個思路求出得到最大間隔時所要滿足的條件。
如上圖,我們設分割超平面為g:w•x+b=0,以它為對稱軸的兩條線為h:w•x+b=1;f:w•x+b=-1
首先必須滿足在h與f線之間沒有任何資料,然後便是支援向量正好在這兩條線上。即:
對於藍色類都滿足w•x+b≥1,且至少有乙個點瞞住w•x+b=1;
對於紅色類都滿足w•x+b≤-1,且至少有乙個點瞞住w•x+b=-1;
我們設藍色類與紅色類的標籤分別為(1,-1),那麼我們把不等式與各自對應的標籤相乘便可以得到乙個綜合的公式,即:y_i (w•x_i+b)≥1。
條件我們找到了,下面就是要推導出h與f線之間間隔的公式。
設h與f間隔為m
因為k向量垂直於h與f,所以z_1=z_0+k (1式)
因為z_1在h上,所以w•z_1+b=1 (2式)
將1式帶入2式得w(z_0+k)+b=1 (3式)
其中k= (m•w)/(||w||) (4式)
將4式帶入3式得w(z_0+(m•w)/(||w||))+b=1 (5式)
化簡5式得w•z_0+b=1-m*||w|| (6式)
因為z_0在f上,所以滿足w•z_0+b=-1 (7式)
將7式帶入6式得:-1=1-m*||w|| (8式)
所以(8式)化簡得到距離m=2/(||w||),可以看出||w||越小m越大
綜上我們可以看出得到最優分割超平面便是得到在滿足y_i (w•x_i+b)≥1時,||w||的最小值。
本節內容便到此結束,下節內容我們拓展一下拉格朗日乘子與kkt的知識,因為我們最後要用到kkt對上式進行變形得到書上所說的優化目標函式:
,以及約束條件:
原文發布時間為:2017-08-17
支援向量機數學原理推導
將支援向量機轉換為數學模型,推導其計算過程,其中主要的步驟概括如下 1.分類超平面的概念 2.間隔和幾何間隔之間的區分 3.求解目標為,正負例中距離分類超平面最近的幾何距離最大化,使得分類最可靠,對雜訊的適應性更強,求解過程中,往往固定間隔為1,求幾何間隔1 w 的最大值,即最小化 w 4.要求所有...
支援向量機數學推導
svm的數學推導真的是我一生的痛,看看覺得很懂,但是過了3秒,就在糾結,為什麼可以這樣換算?今天早上在看整合學習的時候,講課的老師一直說svm svm svm。嗯,沒錯,我又開始回想svm的數學推導過程,然後,我的乙個早上就這樣沒了。這次趁著剛看完印象深刻,我想將剛釐清的思路寫下來。僅包括如何推出最...
支援向量機(SVM)公式推導
假設一堆訓練資料的正負樣本標記為 假設有乙個超平面h 可以通過此線性方程劃分,同時存在兩個平行於 h的超平面h1和 超平面h 能夠正確分類,也就是滿足如下約束 即 離 h最近的正負樣本剛好分別落在h1和 h2上使等號成立,它們就是支援向量。而超平面h1和 h2的距離可知為 注 線到線的距離公式求得 ...