SVM 相關公式推導解釋

2021-06-23 07:20:25 字數 2135 閱讀 5980

題記:

寫這篇文章的背景是這樣的,近期在看《機器學習實戰》這本書,看過一段時間昨天打算大致的回顧下常用分類器的原理和特性,比如k盡量,決策樹,logistic regression,***** bayes 和svm,但當想到svm的時候,自己只知道他的作用及特性,對於其中的原理感覺很模糊,所以就決定仔細的把其中的過程弄明白。自己也查閱了很多網上相關的部落格等,寫的都不錯,但是對於我這種小白來說,強行的去理解記憶其中的公式感覺還是有壓力的,所以自己打算自己簡單的把整個過程捋清楚,公式試著推導。進入正題,我所理解的svm的大致過程可以分如下幾個過程:

1.線性可分的情況---目標函式確定

svm的primal problem 是利用樣本找到乙個超平面,我們定義為

找到一些樣本點(稱之為支撐向量)離這個平面最近,但同時呢有要使這些支撐向量和超平面的間隔(距離)最大,因為樣本點離超平面越遠,那麼分類的confidence越大,這樣通過這個思路我們就可以確定目標函式,這裡有幾何間隔和函式間隔兩種度量方式,具體的兩種間隔的定義和公式可以在相關的部落格中找到,在這裡我們選擇幾何間隔作為度量。這裡我們先給出最大間隔(幾何)分類器原型為:

其中,max部分表示最大幾何間隔,y(i)表示分類標籤,後面的成書項表示該樣本點在分類面什麼地方,通過判斷二者符號是否一致確定分類的正確性,因此用二者乘積表示分類的正確性和可信度,等號右邊的是函式間隔,這即是函式間隔的定義公式。接下來對這個分類器進行改造和轉換,已使滿足我們要求的結果。幾何間隔的定義;

這裡令r =1以便於問題的求解和優化,則我們的目標函式為:

進一步轉換為

公式進化到這一步,也就找到了我們想要的目標函式。

2.求解目標函式

這一步就是對上面所得到的目標函式進行求解,很明顯,這是乙個帶約束條件的求極值問題,很自然的我們會想到用拉格朗日乘數法進行,然後對其中的引數進行求偏導,再將求得的引數值帶入原目標函式,就可求出最終的結果。這一步也就會出現眾多部落格當中所說的對偶問題,第一次聽到「對偶問題」這個詞的時候感覺好高大上啊,神馬叫對「對偶」?是不是複數當中的對偶?,各種疑問油然而生,不過仔細分析過程之後,所謂對偶也就是我經常用到的方法,再給出具體求解中之後再詳細分析。前面提到我們要用拉格朗日乘數法進行求解,因此我們可以將上面的目標函式用通過拉格朗日乘子變換為如下的目標函式:

說明,1代表我們構造出來的新有關那個三個引數的函式,2仍然是目標函式,3為增加了拉格朗日乘子將約束條件加入到函式中,這裡為什麼用求和,是因為我們所有計算的不是針對的是個樣本集,也就是在整個樣本集上尋找最佳的答案。

轉換為新的函式之後,假定拉格朗日因子為常數,對另外兩個引數w和b進行求偏導,過程如下:

推導說明,在對w求導的過程中,將w的平方視作普通變數處理,並且對它的轉置不做區別。求導結果如(2)和(3),將所得結構帶入目標函式l中的結果如下:

因此從式子可以得知,最終的結果之和變數有關,求出了它,那麼也就能求出w和b,從而分類函式也可到。關於這個推導過程還有一點需要說明的也即是對偶問題轉換,剛開始對於目標函式l先求min使w和b最小然後再求max而經過拉格朗日因子轉換之後,先求max然後再min求w和b,這個轉換的過程即使對偶求解的過程,在對偶轉換的問題上需要滿足乙個kkt條件,這裡就不多說了。

射頻微波相關公式

自由空間是理想介質,是不會吸收電磁能量的。自由空間的傳輸損耗是指天線輻射的電磁波在傳播過程中,隨著傳播距離的增大,能量的自然擴散而引起的損耗,它反映了球面波的擴散損耗 球面波指等相面是球面,且在等相面上振幅處處相等的波 自由空間的傳輸損耗為 或其中,d為電波傳播距離,f為工作頻率,為工作波長。英雌在...

資料結構相關公式

判斷棧空 s top 1 判斷棧滿 s top maxsize 1 棧的中綴轉字尾運算 9 3 1 3 10 2 中綴 9 3 1 3 10 2 字尾 規則 遇到數字直接輸出,左括號和小於棧頂元素優先順序的進棧,右括號匹配到左括號出棧,優先順序大於棧頂元素優先順序的入棧。字尾表示式計算 9 3 1 ...

線性回歸基礎相關公式

通常輸入 x 具有多個屬性值,翻譯過來就是一條資料具有多個特徵值。當我們假定最簡單的一種情況,也就是說輸入只有乙個屬性值的時候,此時就是一元線性回歸。線性回歸試圖 f x wx b,使得 f x 真實值 y,所以線性回歸的演算法,轉化為數學問題就是,尋找乙個恰當的引數,使得 f x 盡可能的逼近 y...