半監督學習的簡單介紹

2021-08-25 19:45:36 字數 909 閱讀 6182

半監督分類(semi-supervised classification):同時利用大量無標號樣本和少量標號樣本進行分類學習,以獲得比僅利用標號樣本的監督分類學習更好的分類效能。

目前的半監督分類方法可大致分為四大類:

生成式(generative)方法

大間隔半監督分類方法

基於圖的半監督分類方法

協同訓練(co-training)方法

學習原理

半監督分類利用無標號樣本幫助提公升學習效能

1.試圖挖掘隱藏在無標號樣本中的資料分布資訊,並利用該資訊指導分類;

2.為挖掘資料分布資訊,必須採用某種資料分布假設;

3.最常用的資料分布假設為聚類假設(cluster assumption)和流形假設(manifold assumption)。

聚類假設

假定屬於同一聚類的樣本有較大可能共享相同的類標號。

等價表述:分類邊界應穿越資料分布的低密度區域,從而使聚類內(高密度區域中)樣本被劃分在分類邊界兩側,也被稱為低密度分割假設 (low-density separation assumption)。

流形假設

假定資料分布在一低維流形上,流形結構可由一無向圖表示,圖中結點代表樣本,邊權代表樣本間相似性。在流形結構上相似的樣本具有相似類標號。

半監督學習

一般認為,半監督學習的研究始於 b.shahshahani 和 d.landgrebe 的工作 shahshahanil94 但未標記示例的價值實際上早在上世紀 80 年代末就已經被一些研究者意識到了 lippman89 d.j.miller 和 h.s.uyar milleru97 認為,半監督學...

半監督學習

最近的一段時間一直在學習半監督學習演算法,目前,國內的南京大學周志華老師是這方面的泰斗,寫了很多這方面牛的文章,可以參考一下他的主頁 在國內的學術界周老師一直是我比較欽佩的人之一。下面貼出來的文章出自周老師之手,通俗易懂。受益匪淺。一般認為,半監督學習的研究始於 b.shahshahani 和 d....

半監督學習

目前,國內的南京大學周志華老師是這方面的泰斗,寫了很多這方面牛的文章,可以參考一下他的主頁 下面貼出來的文章出自周老師之手,通俗易懂。受益匪淺。一般認為,半監督學習的研究始於 b.shahshahani 和 d.landgrebe 的工作 shahshahanil94 但未標記示例的價值實際上早在上...