最近在做模式識別,想通過svm+opencv+vs2015+mnist實現手寫數字識別,老師要求自己把模式識別的演算法寫出來,自己之前就對支援向量機的強大功能表示出興趣,正好利用這個機會好好學習一下svm,因此這就是這篇博文的由來。第一次寫博文,主要是作為乙個筆記記錄的工作,如果我的文章對你有一些幫助,那也是令我值得高興的。
這是我正是學習svm看的第一篇博文可以看出博主非常的用心,邏輯非常的清晰,我看完後基本明白了svm是個什麼樣的演算法。下面就寫一下我的理解。
在模式識別中分類問題一直是經久不衰的議題,為了實現更好的分類,研究人員提出了很多演算法。svm便是其中的一種。svm最開始只適用於線性可分的資料分類,後面為了解決線性不可分,引入了將低緯度的資料對映的高緯度,再在高緯度進行計算,如乙個一高一低兩個環,在二維的情況下,只能看到乙個同心圓,無法用一條直線把它們分割開,但是將這個同心圓還原到三維時,只需要在側面畫一條直線就可以分開。但是,在實際實現過程中,發現在高維去計算的話計算量很大,不利於分類的時效性,因此,引入了核函式,核函式是乙個函式,這個函式的引數只有有限個,也就是說這個函式表示的影象是在低緯度的,這樣計算量會大大減少。但是它拆分開後又可以等價為高緯度的計算,因此相當於用較少的計算量實現了高緯度的計算。以上便是svm演算法的大致理解。
SVM學習筆記
svm方法被稱為最大間隔分類,考慮乙個兩個feature的例子,如下圖所示,所有的劃分都是正確的,但顯然紅色的線是最好的劃分,因為其抵抗擾動的能力更強,容錯性更好,魯棒性好。兩類中最靠近分類界限的點沿分類線 平面 的距離最大,這個距離就是所謂的magin,中文應該是間隔的意思。如下圖中的紅色兩個點,...
SVM學習筆記
1 svm尋找區分兩類的超平面,使邊際最大。2 線性可區分,線性不可區分 3 所有坐落在邊際兩邊的超平面上的點被稱為支援向量。4 最大邊際距離為2 w 其中 w 為向量範數 5 svm特點 5.1 訓練好的模型的演算法複雜度是由支援向量的個數決定的,而不是由資料維度決定的,所以svm不太容易產生過擬...
機器學習筆記 SVM
優點 泛化錯誤率低,計算開銷不大,結果易解釋。缺點 對引數調節和核函式的選擇敏感,原始分類器不加修改僅適用於處理二類問題。適用資料型別 數值型和標稱型資料 支援向量機最主要的還是選出離分隔超平面最近的點,這些點叫支援向量,然後最大化支援向量到分隔面的距離。不能耐心的看完svm的理論了,實在是太多。等...