multibox之前所有的檢測演算法都是使用傳統方法來提取候選框,而multibox則是使用了神經網路來提取候選框,並且multibox的loss函式很好的解決了定位和分類的loss分配問題,並且提出了prior的思想。
作者使用了兩個alexnet來組成整個網路,其中乙個alexnet用來做候選框的回歸,另乙個則負責分類。
下面來講一下用來做候選框回歸的alexnet。首先alex會生成k個框,原**中k=100,其中每個框的格式為:
其中x1,y1為左上角的點,x2,y2為右下角的點,c為置信度,取值範圍為0到1,置信度為前景對背景的概率,作者在使用的時候,會將生成的k=100個框按置信度進行排序,只取前10個使用,如果想要速度更快可以使用nms進行篩選。
作者使用1000萬個iou>0.5的正樣本和2000萬個iou<0.2的負樣本(背景)
優化定位框:
li是**框,gj是真是框,xij取值為0或者1,表示當前**框是否命中待**目標,並且xij對i的求和必定為1,例如100個**框只有乙個框是匹配的,
優化置信度:
使用的為二值交叉熵損失函式
損失函式:
alpha的值作者在**中取得是0.3,用來平衡置信度和邊界框回歸的值
每日一網 Day8 DeepBox簡單理解
物件的精確類別比 前景或者背景更困難,對於生產region proposal的過程中我們不需要判斷框中物體對應的類別,也不希望生成候選區的過程像檢測網路一樣複雜,所以我們可以使用相對輕量級的網路結構來捕獲前景的範圍。deepbox主要幹了一件事,用乙個cnn,對傳統方法產生的proposal重新進行...
每日一網 Day18 OHEM簡單理解
作者提出了一種困難負樣本挖掘的方法,困難負樣本是指模型難以區分的負樣本,也就是容易將負樣本當成正樣本的那些樣本。例如,當roi中沒有目標,全是背景的時候,這時候分類器就很容易正確分類成背景,這就是 容易負樣本 如果roi中有一半是目標,但是標籤仍然是背景,這個時候分類器就容易把它當作成正樣本,這就是...
每日一網 Day21 SSD簡單理解
終於開始 one stage了 ssd是作者在eccv 2016上發表的 對於輸入尺寸300x300的網路是喲個titan x在voc2007測試集上達到74.3 map以及59fps,對於512x512的網路,達到了76.9 map,超越當時最強的fast rcnn 不同特徵圖設定的先驗框數目不同...