每日一網 Day21 SSD簡單理解

2021-10-13 19:05:22 字數 1624 閱讀 1519

終於開始 one-stage了

ssd是作者在eccv 2016上發表的**,對於輸入尺寸300x300的網路是喲個titan x在voc2007測試集上達到74.3%map以及59fps,對於512x512的網路,達到了76.9%map,超越當時最強的fast rcnn

不同特徵圖設定的先驗框數目不同(同乙個特徵圖上每個單元設定的先驗框是相同的,這裡的數目指的是乙個單元的先驗框數目)。先驗框的設定,包括尺度(或者說大小)和長寬比兩個方面。對於先驗框的尺度,其遵守乙個線性遞增規則:隨著特徵圖大小降低,先驗框尺度線性增加:

其中m指的是特徵圖的個數,但是是5,因為第一層的是單獨設定的 ,sk表示anchor大小相當於的比例,smin和smax表示比例的最小值與最大值,**中取值為0.2和0.9.

對於長寬比,一般選取

,對於特定的長寬比,按如下公式計算anchor的寬度與高度

預設情況下,每個特徵圖會有乙個αr=1且尺度為sk的anchor,除此之外,還會設定乙個尺度為

的anchor。綜合計算,ssd中的anchor設定情況如下圖:

**過程比較簡單,對於每個**框,首先根據類別置信度確定其類別(置信度最大者)與置信度值,並過濾掉屬於背景的**框。然後根據置信度閾值(如0.5)過濾掉閾值較低的**框。對於留下的**框進行解碼,根據先驗框得到其真實的位置引數(解碼後一般還需要做clip,防止**框位置超出)。解碼之後,一般需要根據置信度進行降序排列,然後僅保留top-k(如400)個**框。最後就是進行nms演算法,過濾掉那些重疊度較大的**框。最後剩餘的**框就是檢測結果了。

正樣本:

1、與gt的iiou最大的box

2、與任意gt的iou大於0.5

負樣本:

計算最大置信度loss,然後按負樣本:正樣本 = 3:1的比例選擇負樣本,簡稱為hard negative mining。

類別損失:

定位損失:

每日一網 Day5 MultiBox簡單理解

multibox之前所有的檢測演算法都是使用傳統方法來提取候選框,而multibox則是使用了神經網路來提取候選框,並且multibox的loss函式很好的解決了定位和分類的loss分配問題,並且提出了prior的思想。作者使用了兩個alexnet來組成整個網路,其中乙個alexnet用來做候選框的...

每日一網 Day8 DeepBox簡單理解

物件的精確類別比 前景或者背景更困難,對於生產region proposal的過程中我們不需要判斷框中物體對應的類別,也不希望生成候選區的過程像檢測網路一樣複雜,所以我們可以使用相對輕量級的網路結構來捕獲前景的範圍。deepbox主要幹了一件事,用乙個cnn,對傳統方法產生的proposal重新進行...

每日一網 Day18 OHEM簡單理解

作者提出了一種困難負樣本挖掘的方法,困難負樣本是指模型難以區分的負樣本,也就是容易將負樣本當成正樣本的那些樣本。例如,當roi中沒有目標,全是背景的時候,這時候分類器就很容易正確分類成背景,這就是 容易負樣本 如果roi中有一半是目標,但是標籤仍然是背景,這個時候分類器就容易把它當作成正樣本,這就是...