注:《遷移學習簡明手冊》
一、什麼是遷移學習:
遷移學習作為機器學習的⼀個重要分⽀,側重於將已經學習過的知識遷移應⽤於新的問題中。核⼼問題是,找到新問題和原問題之間的相似性,才可以順利地實現知識的遷移。
舉一反三,照葫蘆畫瓢,照貓畫虎...
定義:
是指利⽤資料、任務、或模型之間的相似性,將在舊領域學習過的模型,應⽤於新領域的⼀種學習過程。
楊強老師的一篇綜述:『a survey on transfer learning[pan and yang, 2010]』
二、為什麼需要遷移學習:
1、大資料與少標註之間的矛盾
大資料時代的問題:缺少完善的資料標註——模型訓練和更新的依賴
資料標註代價高、所用時間長,目前沒有有效的方式解決此問題。
2、大資料與弱計算之間的矛盾
大資料需要大裝置、強計算能力的裝置儲存和計算,是「有錢人」才能玩的起的遊戲。
3、普適化模型與個性化需求之間的矛盾
ml的目標是盡可能的通用模型——模型的泛化能力
不同的使用者有不同的需求——個性化需求,同時也有一些隱私需求。唯一性、特異性
4、特定應用的需求
特定領域——特定需求——現實存在的問題,如:推薦系統冷啟動問題
遷移學如何解決這些問題:
大資料與少標註:遷移資料標註——尋找相似的有標註的資料進行新資料標註
大資料與弱計算:模型遷移——將已經訓練好的模型遷移到專案中,微調、自適應優化更新模型
普適化模型與個性化需求:自適應學習——普適化模型進行自適應學習,靈活調整
特定應用的需求:相似領域知識遷移——相似領域遷移
三、遷移學習與相近概念區別:
遷移學習 vs 傳統機器學習:
遷移學習 vs 終身學習:終⾝學習強調連續不斷地在⼀個概念和任務上進⾏學習,模型持續優化。遷移學習則側重於模型的遷移和共同學習。
遷移學習 vs 多工學習:多工學習指多個相關的任務⼀起協同學習;遷移學習則強調知識由⼀個領域遷移到另⼀個領域的過程。遷移是思想,多工是其中的⼀個具體形式。
. 遷移學習 vs 領域自適應:領域⾃適應問題是遷移學習的研究內容之⼀,它側重於解決特徵空間⼀致、類別空間⼀致,僅特徵分布不⼀致的問題。⽽遷移學習也可以解決上述內容不⼀致的情況。
遷移學習 vs 增量學習:增量學習側重解決資料不斷到來,模型不斷更新的問題。遷移學習顯然和其有著不同之處。
遷移學習 vs 自我學習:⾃我學習指的是模型不斷地從⾃⾝處進⾏更新,⽽遷移學習強調知識在不同的領域間進⾏遷移。
遷移學習 vs 協方差漂移:協⽅差漂移也是遷移學習要研究的問題之⼀,它特指資料的條件概率分布發⽣變化。
負遷移:——引入遷移學習中的乙個負面現象
定義:在源域上學習到的知識,對於目標域上的學習產⽣負面作用。
兩個領域之間不存在相似性,或者基本不相似——遷移學習效果差
原因:
1、資料問題:源域和⽬標域壓根不相似,談何遷移?
2、源域和⽬標域是相似的,但是,遷移學習⽅法不夠好,沒找到可遷移的成分。
最新的研究成果
transitive transfer learning [tan et al., 2015]——傳遞遷移學習:兩個領域不相似,利用兩者之間的若干領域進行傳遞式遷移。
distant domain transfer learning [tan et al., 2017]——用人臉識別飛機
四、遷移學習的研究領域——沒有統一標準
1、按照目標域分類:
監督遷移學習 (supervised transfer learning),半監督遷移學習 (semi-supervised transfer learning),⽆監督遷移學習 (unsupervised transfer learning)
難點:半監督、監督
2、按照學習方法分類:
1、資料問題:源域和⽬標域壓根不相似,談何遷移?
1. 基於樣本的遷移學習⽅法 (instance based transfer learning)——基於例項的遷移,簡單來說就是通過權重重⽤,對源域和⽬標域的樣例進⾏遷移。比如相似度高權重高
2. 基於特徵的遷移學習⽅法 (feature based transfer learning)——更進⼀步對特徵進⾏變換。
3. 基於模型的遷移學習⽅法 (model based transfer learning)
4. 基於關係的遷移學習⽅法 (relation based transfer learning)
p8
fafafag
fasdf
fasfafa
dfaf
12da
dfaf
fasdf
fasfd
- fa
fafd
學習筆記
知乎——小王愛遷移
時間盲注手注
基於時間的盲注 時間的概念 使用特定函式讓資料庫去執行,通過自己的設定,來檢視資料庫是否get到我們的請求 函式sleep 設定資料庫的延時或者暫停的時間 函式limit 0,1 限制第乙個的第乙個字元 函式mid 1,1 從第乙個字元開始擷取,只擷取乙個 函式benchmark 引數一,引數二 第...
布林盲注手注
布林盲注 mid str,1,3 字串擷取 意思就是把str這個字串從第乙個字串開始,擷取前三個顯示 substr 這個函式和上面的用法一樣,也是用來擷取字串的 ord 轉換成ascii碼 length 統計長度 version 是檢視資料庫版本 database 檢視當前資料庫名 user 檢視當...
遷移分支 資料 遷移學習簡明手冊
遷移學習作為機器學習的一大分支,已經取得了長足的進步。本手冊簡明地介紹遷移學習的概念與基本方法,並對其中的領域自適應問題中的若干代表性方法進行講述。最後簡要 遷移學習未來可能的方向。本手冊編寫的目的是幫助遷移學習領域的初學者快速入門並掌握基本方法,為自己的研究和應用工作打下良好基礎。本手冊的編寫邏輯...