SVM分類器自我總結

2021-09-19 04:34:15 字數 1166 閱讀 6734

svm(support vector machine)簡單的說是乙個分類器,並且是二類分類器。

vector:通俗說就是點,或是資料。

machine:也就是classifier,也就是分類器。

給定訓練樣本,支援向量機建立乙個超平面作為決策曲面,使得正例和反例的隔離邊界最大化。

我們需要這個曲面仍然滿足跟所有任意紅球和藍球的間距的最大化。需要找到的這個曲面,就是我們後面詳細了解的最優超平面。

線性可分-linearly separable, 在二維空間可以理解為可以用一條直線(乙個函式)把兩型別的樣本隔開,被隔離開來的兩類樣本即為線性可分樣本。同理在高維空間,可以理解為可以被乙個曲面(高維函式)隔開的兩類樣本。

線性不可分,則可以理解為自變數和因變數之間的關係不是線性的。

現實中大多數問題都是 線性不可分的

解決線性不可分問題的基本思路——向高維空間轉化,使其變得線性可分。

轉化最關鍵的部分就在於找到x到y的對映方法。

y為n維度變數,則f(y)為n+1維空間裡的函式。

使用核函式使得線性不可分的問題可分。

核函式的基本作用就是接受兩個低維空間裡的向量,能夠計算出經過某個變換後在高維空間裡的向量內積值。

遙感中使用的svm 基於徑向的核心函式最合。

將svm用於多類分類,採用一對一的多類分類方法最優。

這樣在分類時,我們就可以先問分類器「1對5」(意思是它能夠回答「是第1類還是第5類」),如果它回答5,我們就往左走,再問「2對5」這個分類器,如果它還說是「5」,我們就繼續往左走,這樣一直問下去,就可以得到分類結果。好處在哪?我們其實只呼叫了4個分類器(如果類別數是k,則只呼叫k-1個),分類速度飛快,且沒有分類重疊和不可分類現象!缺點在哪?假如最一開始的分類器回答錯誤(明明是類別1的文章,它說成了5),那麼後面的分類器是無論如何也無法糾正它的錯誤的(因為後面的分類器壓根沒有出現「1」這個類別標籤),其實對下面每一層的分類器都存在這種錯誤向下累積的現象。。

SVM入門 線性分類器(2)

線性分類器 一定意義上,也可以叫做感知機 是最簡單也很有效的分類器形式.在乙個線性分類器中,可以看到svm形成的思路,並接觸很多svm的核心概念.用乙個二維空間裡僅有兩類樣本的分類問題來舉個小例子。如圖所示 c1和c2是要區分的兩個類別,在二維平面中它們的樣本如上圖所示。中間的直線就是乙個分類函式,...

Matlab 線性分類器與SVM

利用最小二乘法求線性分類器係數 如下 function w,b leastsquares traindata,trainlabel 最小二乘法線性分類器 nums,demens size traindata traindata traindata,ones nums,1 r traindata tr...

SVM 分類器的分類超平面的繪製

load libraries from sklearn.svm import linearsvc from sklearn import datasets from sklearn.preprocessing import standardscaler import numpy as np from...