對於標籤(真值表)、訓練集收集難度大、收集時間長、收集代價高,且對於此緊急的資料,強監督學習可能趕不上它的更新或緊急程度。
弱監督通常分為三種型別:不完全監督、不確切監督、不準確監督。
指的是訓練資料只有部分是帶有標籤的,同時大量資料是沒有被標註過的。這是最常見的由於標註成本過高而導致無法獲得完全的強監督訊號的情況
流行的學習正規化有主動學習、半監督學習、遷移學習。
主動學習:
它假設未標註資料的真值標籤可以向人類專家查詢,讓專家為估計模型最有價值的資料點打上標籤。在我們只考慮用查詢次數衡量標出成本的情況下,主動學習的目標是在提高查詢效率,在查詢次數盡可能小的情況下,使得訓練出的模型效能最好。
衡量查詢樣本的價值時,有兩個被最廣泛使用的標準:資訊量和代表性。
半監督學習(semi-supervised learning):
半監督學習是一種在沒有人類專家參與的情況下對未標註資料加以分析、利用的學習正規化。通常,儘管未標註的樣本沒有明確的標籤資訊,但是其資料的分布特徵與已標註樣本的分布往往是相關的,這樣的統計特性對於**模型是十分有用的。
遷移學習(transfer learning)
把乙個領域(源領域,標籤很好獲取,而且大量充足)的訓練好的模型,遷移到另外乙個領域(目標領域,通常標籤很難獲得,而且很少),微調一下可能就使得目標領域能夠取得更好的學習效果。
關注於給定了監督資訊,給定粗顆粒度標籤,但資訊不夠精確的場景。比如我要判斷某個圖是否包含車,我能給這個乙個標籤,但我不能給出有什麼具體特徵判斷這個有車
我可以給標籤,但這個標籤不總是對的。你不能全按照我的標籤來學習。
弱監督學習總結(1)
在學習過udacity和吳恩達的deeplearning課程之後,我對深度學習又有了新的一些看法。確實,深度學習在語音 影象和自然語言方面相比傳統演算法有長足的進步,很多方面的識別率超過人類水平,於是各路 大肆渲染深度學習演算法的神奇之處,說著說著就將深度學習演算法和人工智慧混為一談,認為再過不久,...
機器學習筆記 監督學習,無監督學習,半監督學習
這個問題可以回答得很簡單 是否有監督 supervised 就看輸入資料是否有標籤 label 輸入資料有標籤,則為有監督學習,沒標籤則為無監督學習。什麼是學習 learning 學習 乙個成語就可概括 舉一反三。此處以高考為例,高考的題目在上考場前我們未必做過,但在高中三年我們做過很多很多題目,懂...
監督學習和無監督學習 監督學習與非監督學習
監督學習 supervised learning 的任務是學習乙個模型,使模型能夠對任意給定的輸入,對其相應的輸出做出乙個好的 即 利用訓練資料集學習乙個模型,再用模型對測試樣本集進行 例如kaggle上的鐵達尼號比賽。官方提供旅客資料 資料集1 姓名,年齡,性別,社會經濟階層,是否生存等 要求參賽...