什麼是核:(核或正定核) 定義在上的函式是核函式,如果存在乙個從到hilbert空間的對映
(1.1)
使得對任意的,
(1.2)
都成立。其中表示hilbert空間中的內積。
多核學習的本質就是用k個核函式凸組合代替上述的單個核函式且滿足
k≥o且 ,k=1,2,...,k。可用來理解樣本的哪個特徵能更有效地區分樣本。
多核學習的優點
當樣本特徵含有異構資訊(heterogeneous information),樣本規模很大, 多維資料的不規則(unnormaliseddata)或資料在高維特徵空間分布的不平坦, 採用單個簡單核進行對映的方式對所有樣本進行處理並不合理。
多核學習的研究
多核模型是一類靈活性更強的基於核的學習模型, 在多核框架下, 樣本在特徵空間中的表示問題轉化成為基本核與權係數的選擇問題。
研究人員大都研究(1)核函式權係數的選擇問題。如非平穩的多核學習方法, 區域性多核學習方法,非稀疏多核學習方法等(2)多核學習理論。如早期的基於boosting的多核組合模型學習方法, 基於半定規劃(semide¯nite programming, sdp) 的多核學習方法, 基於二次約束型二次規劃(quadratically constrained quadratic program, qcqp)的學習方法, 基於半無限線性規劃(semi-in¯nitelinear program, silp)的學習方法, 基於超核(hyperkernels)的學習方法, 以及近來出現的簡單多核學習(****** mkl)方法和基於分組lasso思想的多核學習方法。
多核學習的演算法流程
多核學習缺點:
儘管多核學習在解決一些異構資料集問題上表現出了非常優秀的效能,但不得不說效率是多核學習發展的最大瓶頸。首先,空間方面,多核學習演算法由於需要計算各個核矩陣對應的核組合係數,需要多個核矩陣共同參加運算。也就是說,多個核矩陣需要同時儲存在記憶體中,如果樣本的個數過多,那麼核矩陣的維數也會非常大,如果核的個數也很多,這無疑會占用很大的記憶體空間。其次,時間方面,傳統的求解核組合引數的方法即是轉化為sdp優化問題求解,而求解sdp問題需要使用內點法,非常耗費時間,儘管後續的一些改進演算法能在耗費的時間上有所減少,但依然不能有效的降低時間複雜度。高耗的時間和空間複雜度是導致多核學習演算法不能廣泛應用的乙個重要原因。
基於多核學習的高效能核分類方法研究
多核學習方法介紹
通過上篇文章的學習,我們知道,相比於單個核函式,多核模型可以具有更高的靈活性。經過多個核函式對映後的高維空間是由多個特徵空間組合而成的組合空間,而顯然組合空間可以組合各個子空間不同的特徵對映能力,能夠將異構資料中的不同特徵分量分別通過最合適的單個核函式進行對映,最終使得資料在新的組合空間中能夠得到更...
SVM多核學習方法簡介
svm是機器學習有監督學習的一種方法,常用於解決分類問題,其基本原理是 在特徵空間裡尋找乙個超平面,以最小的錯分率把正負樣本分開。因為svm既能達到工業界的要求,機器學習研究者又能知道其背後的原理,所以svm有著舉足輕重的地位。但是我們之前接觸過的svm都是單核的,即它是基於單個特徵空間的。在實際應...
SVM多核學習方法簡介
svm是機器學習有監督學習的一種方法,常用於解決分類問題,其基本原理是 在特徵空間裡尋找乙個超平面,以最小的錯分率把正負樣本分開。因為svm既能達到工業界的要求,機器學習研究者又能知道其背後的原理,所以svm有著舉足輕重的地位。但是我們之前接觸過的svm都是單核的,即它是基於單個特徵空間的。在實際應...