**物件的精確類別比**前景或者背景更困難,對於生產region proposal的過程中我們不需要判斷框中物體對應的類別,也不希望生成候選區的過程像檢測網路一樣複雜,所以我們可以使用相對輕量級的網路結構來捕獲前景的範圍。
deepbox主要幹了一件事,用乙個cnn,對傳統方法產生的proposal重新進行打分,把更準確的區域賦予更高的分數,通俗來說,傳統方法(如edgebox)產生的每個proposal都有得分,但是得分有高有低,有時候最準的box等分不一定是最高的,得分最高的不一定是最準的,因此用乙個cnn對這個得分進行修正
作者經過一系列實驗,最終實驗出了乙個四層的網路:conv(11,96,4)−pool(3,2)−conv(5,256,1)−fc(1024)−fc(2).
如圖:
網路實現的過程也很簡單:
首先用傳統方法生產region proposal,然後輸入deepbox的網路重新打分,最後輸出兩個值,分別是前景的置信度和背景的置信度。
每日一網 Day5 MultiBox簡單理解
multibox之前所有的檢測演算法都是使用傳統方法來提取候選框,而multibox則是使用了神經網路來提取候選框,並且multibox的loss函式很好的解決了定位和分類的loss分配問題,並且提出了prior的思想。作者使用了兩個alexnet來組成整個網路,其中乙個alexnet用來做候選框的...
每日一網 Day18 OHEM簡單理解
作者提出了一種困難負樣本挖掘的方法,困難負樣本是指模型難以區分的負樣本,也就是容易將負樣本當成正樣本的那些樣本。例如,當roi中沒有目標,全是背景的時候,這時候分類器就很容易正確分類成背景,這就是 容易負樣本 如果roi中有一半是目標,但是標籤仍然是背景,這個時候分類器就容易把它當作成正樣本,這就是...
每日一網 Day21 SSD簡單理解
終於開始 one stage了 ssd是作者在eccv 2016上發表的 對於輸入尺寸300x300的網路是喲個titan x在voc2007測試集上達到74.3 map以及59fps,對於512x512的網路,達到了76.9 map,超越當時最強的fast rcnn 不同特徵圖設定的先驗框數目不同...