overfeat: integrated recognition, localization and detection using convolutional networks
部分翻譯:
提出了一種利用卷積網路進行分類、定位和檢測的綜合框架。我們展示了乙個多尺度和滑動視窗的方法可以有效地實現在乙個convnet。我們還介紹了一種新的深度學習方法,通過學習**物件的邊界來定位。然後,為了增加檢測的置信度,對邊界框進行累積而不是抑制。我們證明了使用乙個共享網路可以同時學習不同的任務。
在本文中,我們探索了三個難度遞增的計算機視覺任務:(i)分類、(ii)定位和(iii)檢測。每個任務都是下乙個任務的子任務。雖然所有任務都是使用乙個框架和乙個共享的特性學習基礎來處理的,但是我們將在下面的部分中分別描述它們。
我們的分類架構類似於最好的ilsvrc12架構by krizhevskyet al.[15]。但在網路設計和推理步驟上進行了改進。由於時間的限制,krizhevskyet 模型中的一些訓練特性沒有得到充分的探索,因此我們期望我們的結果能夠得到進一步的提高。這些將在以後的工作第6節中討論
我們使用imagenet 2012培訓集(120萬張,c = 1000個類)[5]對網路進行培訓。我們的模型使用了krizhevsky等人在訓練時提出的相同的固定輸入大小方法,但是在下一節中我們將轉向多尺度分類。每幅影象都向下取樣,使最小的維數為256畫素。然後我們提取5個大小為221x221畫素的隨機作物(以及它們的水平翻轉),並以128畫素的小批量呈現給網路。在網路初始化隨機權重(µσ)= (0,1×10−2)。然後更新通過隨機梯度下降,伴隨著動量項的0.6和ℓ2重量1×10−5的衰變。學習速率最初為5×10−2,經過(30、50、60、70、80)個世代後,學習速率依次降低0.5倍。在分類器的全連通層(6層和7層)上採用了速度為0.5的dropout [11]
寫不下去了,以後補充
未完待續。。。。
OverFeat 個人總結
卷積網路的優點 end to end,由畫素對應到最終的類別 缺點 需要大量已標記的樣本 本文主要介紹了利用overfeat進行分類 定位和檢測這三大視覺任務。1.分類 影象中通常包含乙個大型物件,每張影象分配乙個該影象中主要物件的label,允許5個prediction來找到正確的label,因為...
(翻譯 部分總結)莫隊演算法入門小結
最近入門了莫隊演算法,覺得好玄妙,為自己寫個小結。我初學莫隊演算法是通過這個部落格理解的 戳這裡,只不過是英文的,其他人也寫過這篇博文的翻譯,特此註明。下面我的小結也主要圍繞這個問題來談。考慮這個問題 給定乙個序列,共有m次詢問,每次詢問區間中出現次數大於等於3的數字有多少個。我們先來考慮n,m較小...
Qt 藍芽部分翻譯
大部分都是直譯,如有不妥,還請制導。the bluetooth api provides connectivity between bluetooth enabled devices.這個藍芽api為藍芽裝置之間提供連線。currently,the api is supported on the f...