內容泛化是什麼意思 什麼是支援向量?

2021-10-13 15:45:51 字數 1421 閱讀 5569

支援向量機(support vector machines,svm)是一種二分類模型,它的基本模型是定義在特徵空間上的間隔最大的線性分類器。除此之外,svm演算法還包括核函式,核函式可以使它成為非線性分類器。在了解svm演算法之前,我們要先認識一下線性分類器。

線性分類器:假設在乙個二維線性可分的資料集中,我們要找到乙個超平面把兩組資料分開,已知的方法有我們已經學過的線性回歸和邏輯回歸,這條直線可以有很多種,如下圖的h1、h2、h3哪一條直線的效果最好呢,也就是說哪條直線可以使兩類的空間大小相隔最大呢?

我們憑直觀感受應該覺得答案是h3。首先h1不能把類別分開,這個分類器肯定是不行的;h2可以,但分割線與最近的資料點只有很小的間隔,如果測試資料有一些雜訊的話可能就會被h2錯誤分類(即對雜訊敏感、泛化能力弱)。h3以較大間隔將它們分開,這樣就能容忍測試資料的一些雜訊而正確分類,是乙個泛化能力不錯的分類器。因此我們把這個劃分資料的決策邊界就叫做超平面。離這個超平面最近的點就是」支援向量」,點到超平面的距離叫做間隔,支援向量機的意思就是使超平面和支援向量之間的間隔盡可能的大,這樣才可以使兩類樣本準確地分開。

a) 線性可分svm:當資料線性可分的時候,通過硬間隔最大化可以學習得到乙個線性分類器,即硬間隔svm,如上圖的h3

b) 線性svm:當訓練資料不能線性可分但是可以近似線性可分時,通過軟間隔(soft margin)最大化也可以學習到乙個線性分類器,即軟間隔svm

c) 非線性svm:

當訓練資料線性不可分時,通過使用核技巧(kernel trick)和軟間隔最大化,可以學習到乙個非線性svm。

我們從圖上可以看到,這條中間的實線代表的超平面離直線兩邊的資料的間隔最大,對訓練集的資料的雜訊有最大的包容力。

對乙個分類問題,我們假設

我們知道,所謂的支援向量,就是使得上式等號成立,即最靠近兩條虛邊界線的向量。為什麼像上面的式子那麼假設呢?其實是為了方便計算。

這就得到了我們要用的svm的基本形式,通過求解上式就可以得到最優超平面ω和b,具體求解方法我們將在下一節內容中講。

內容泛化是什麼意思 心理加工之情緒泛化

泛化在心理學上是指,引發個體不良情緒的誘因已經不侷限於最初那個具體個別的物件 事件和內容,而是當出現與最初這個刺激事件相類似的情境時也一樣會引發個體的不良情緒,用比較形象的說法就是,一朝被蛇咬,十年怕井繩。為什麼會有情緒泛化的現象呢?為了社會適應,乙個人從小到大除了生理上的成長,還伴隨著心理上的成長...

內容泛化是什麼意思 品牌為什麼還要做IP?

有兩個詞彙,在現在做品牌過程中,避不開,那就是品牌與ip。我們有必要追本溯源,弄清楚到底什麼是品牌,什麼又是ip。好多人對這兩個概念,混淆起來,混為一談。品牌 雖然是乙個現代詞彙,要弄明白品牌,追本溯源,我們需要從 品 和 牌 的字意上,去追尋品牌的含義。品 會意字,從三口。口代表人,三個表多數,意...

什麼是DFT,DFT是什麼意思

dft 數位電路 fpga asic 設計入門之可測試設計與可測性分析,離散傅利葉變換,dft direct fouriet transformer 可測試性技術 design for testability dft 就是試圖增加電路中訊號的可控制性和可觀測性,以便及時經濟地測試晶元是否存在物理缺陷...