資料增強是機器學習中常用的trick,特別是用於樣本不足的情況下的一種提公升機器學習模型效能的重要手段。看了谷歌開源的資料增強文章,裡面已經實現得比較全的,做了簡單實驗,效果還是不錯。
從其開放**(中可以看出,該類已經封裝了較多的資料增強操作。
class autoaugment(object):
def __init__(self):
self.policies = [
['invert', 0.1, 7, 'contrast', 0.2, 6],
['rotate', 0.7, 2, 'translatex', 0.3, 9],
['sharpness', 0.8, 1, 'sharpness', 0.9, 3],
['sheary', 0.5, 8, 'translatey', 0.7, 9],
['autocontrast', 0.5, 8, 'equalize', 0.9, 2],
['sheary', 0.2, 7, 'posterize', 0.3, 7],
['color', 0.4, 3, 'brightness', 0.6, 7],
['sharpness', 0.3, 9, 'brightness', 0.7, 9],
['equalize', 0.6, 5, 'equalize', 0.5, 1],
['contrast', 0.6, 7, 'sharpness', 0.6, 5],
['color', 0.7, 7, 'translatex', 0.5, 8],
['equalize', 0.3, 7, 'autocontrast', 0.4, 8],
['translatey', 0.4, 3, 'sharpness', 0.2, 6],
['brightness', 0.9, 6, 'color', 0.2, 8],
['solarize', 0.5, 2, 'invert', 0, 0.3],
['equalize', 0.2, 0, 'autocontrast', 0.6, 0],
['equalize', 0.2, 8, 'equalize', 0.6, 4],
['color', 0.9, 9, 'equalize', 0.6, 6],
['autocontrast', 0.8, 4, 'solarize', 0.2, 8],
['brightness', 0.1, 3, 'color', 0.7, 0],
['solarize', 0.4, 5, 'autocontrast', 0.9, 3],
['translatey', 0.9, 9, 'translatey', 0.7, 9],
['autocontrast', 0.9, 2, 'solarize', 0.8, 3],
['equalize', 0.8, 8, 'invert', 0.1, 3],
['translatey', 0.7, 9, 'autocontrast', 0.9, 1],
]
實踐測試:
隨機跑了兩次,發現每次的結果都不一樣,而且速度較快! 不過裡面的策略中並不包含有隨機擦除這一功能,需要再擴充套件。
谷歌熊貓世界裡的文章營銷
自從我開始從事seo,文章營銷就是鏈結建設的重要基礎。然而,自從ezinearticles和 suite 101由於谷歌熊貓的更新的問題在排名和流量上都受到了重創,那麼文章營銷還應該成為你所有策略中的一部分嗎?我們需要好好的回顧一下,看看下面這張大圖來找答案。但是仍然還有很多人這樣說,我並不相信像e...
谷歌內容定向的最佳實踐
對此,我請教了我們同事amy clarkson,他是廣告搜尋專家,他談到了在谷歌中利用內容定向的戰略問題,以下是是幾個策略 一 為內容營行單一的宣傳活動。首先要降低某個詞彙的競價,確保你有有效的資料做出決定。乙個詞彙不可能在一周內實現轉換,而隨後的星期其表現會好。三 考慮採用位置定向針對內容宣傳的位...
資料增強 自動駕駛中的資料增強
本文摘取了matt cooper對自動駕駛資料增強的一些看法。文章的核心觀點是,針對特定的模型必須分析確定特定的資料增強器,不能把增強器技術黑箱使用,否在會產生過擬合。問題起源 作者在實習的時候實現乙個資料增強器,以改進物件檢測工作。這其中,一種簡單的技術被稱為裁剪正則化。簡而言之,就是在輸入影象中...