主動學習 主動學習演算法綜述

2021-10-01 09:14:21 字數 943 閱讀 8750

參考文獻:主動學習演算法綜述

主動學習(active learning)

用於解決分類問題的機器學習,如今已經是很熟悉的話題了,我們知道所有分類模型都需使用標記樣本訓練,並且分類模型的效果依賴於標記樣本的質量。乙個好的分類模型離不開大量優質的訓練資料,但是在實際應用條件下,我們得到的資料往往都是沒有經過處理的,而資料的處理是一項相當龐大且繁瑣的工作,並且有時候還需要一些專業人士才能處理,因此需要耗費巨大的人力成本和時間成本。基於此,在機器學習領域中,提出主動學習方法,優化分類模型。

主動學習演算法會通過某些方法找到樣本資料中最有價值的資料,然後我們把刪選出來的資料交由專家進行人工標註後,將標註後的資料放入訓練集對分類模型進行迭代優化訓練,這一過程稱為主動學習

簡單來說,機器學習中的主動學習能夠用更少的人工成本獲取更有價值的標記樣本從而使分類器具有更好的泛化效能。和以往被動學習演算法不同的是,主動學習演算法會根據某一些策略將未標記樣本中的一部分樣本進行標記,然後重新投入訓練集中,用來輔助分類器的訓練。

主動學習演算法可以有以下五個元件進行建模:

a = (c, l, s, q, u)

其中c為乙個或一組分類器;l為一組已標註的訓練集樣本;q為查詢函式,用於在未標註的樣本中查詢資訊量大的樣本;u為整個未標註樣本集;s為督導者,可以對未標註樣本進行標註。

主動學習演算法主要分為兩階段:

第一階段為初始化階段,隨機從未標註樣本中選取一部分作為訓練集並由督導者標註, 用來建立初始分類器模型;

第二階段為迴圈查詢階段,監督者從未標註樣本集u 中,按照某種查詢標準 q ,選取一定的未標註樣本進行標註,並加到訓練集 l 中,重新訓練分類器,直到達到訓練停止標準為止。

主動學習演算法是乙個迭代的過程,分類器使用迭代時反饋的樣本進行訓練,不斷提公升分類效率。

主動學習介紹

主動學習演算法的意義在於使用策略在未標記樣本集合中選擇最有價值的例項,將其交給專家s進行標註,然後將標記樣本增加到下一次對的迭代的訓練集t中,使得分類器進行迭代訓練。典型的主動學習框架介紹 主動學習是乙個迴圈的過程,通過一定的手段從未標記樣本中選擇出有效的標記樣本作為標記樣本,當達到一定的條件或者準...

主動學習教程

有一門程式語言基礎的程式設計師。簡潔,每節課控制在10分鐘左右,不講廢話,但是需要你看完之後去主動學習 下文會提到主動學習 通俗易懂,盡量少的出現晦澀難懂的專業名詞,盡可能用生活中常見的事物去形象地打比方。入門python,僅僅是入門,吃瓜群眾 請問群主我學完能去找一萬工資的工作嗎?群主 問君何不乘...

Active Learning主動學習

active learning主動學習 我們使用一些傳統的監督學習方法做分類的時候,往往是訓練樣本規模越大,分類的效果就越好。但是在現實生活的很多場景中,標記樣本的獲取是比較困難的,這需要領域內的專家來進行人工標註,所花費的時間成本和經濟成本都是很大的。而且,如果訓練樣本的規模過於龐大,訓練的時間花...