對於物體檢測任務, 第4章的faster rcnn演算法採用了兩階的檢測架構, 即首先利用rpn網路進行感興趣區域生成, 然後再對該區域進行類別的分類與位置的回歸, 這種方法雖然顯著提公升了精度, 但也限制了檢測速度。 yolo演算法利用回歸的思想, 使用一階網路直接完成了物體檢測, 速度很快, 但是精度有了明顯的下降。
在此背景下, ssd(single shot multibox detecor) 演算法借鑑了faster rcnn與yolo的思想, 在一階網路的基礎上使用了固定框進行區域生成, 並利用了多層的特徵資訊, 在速度與檢測精度上都有了一定的提公升。
本章將首先介紹ssd方法的主要思想, 然後針對重要的結構模組,從**層面一一解讀其實現方法, 最後將分析ssd的優缺點, 並介紹一些經典的改進演算法。
1. ssd總覽
作為一階網路, ssd演算法從多個角度對物體檢測做了創新, 是乙個既優雅又高效的檢測網路, 本節將從演算法層面簡要介紹ssd的總體過程
1.1 ssd的演算法流程
ssd演算法的演算法流程如圖5.1所示, 輸入影象首先經過了vggnet的基礎網路, 在此之上又增加了幾個卷積層, 然後利用3×3的卷積核在6個大小與深淺不同的特徵層上進行**, 得到預選框的分類與回歸**值, 最後直接**出結果, 或者求得網路損失。
ssd的演算法思想, 主要可以分為4個方面:
·資料增強: ssd在資料部分做了充分的資料增強工作, 包括光學變換與幾何變換等, 極大限度地擴充了資料集的豐富性, 從而有效提公升了模型的檢測精度。
·網路骨架: ssd在原始vggnet的基礎上, 進一步延伸了4個卷積模組, 最深處的特徵圖大小為1×1, 這些特徵圖具有不同的尺度與感受野, 可以負責檢測不同尺度的物體。
·priorbox與多層特徵圖: 與faster rcnn類似, ssd利用了固定大小與寬高的priorbox作為區域生成, 但與faster rcnn不同的是, ssd不是只在乙個特徵圖上設定預選框, 而是在6個不同尺度上都設立預選框, 並且在淺層特徵圖上設立較小的priorbox來負責檢測小物體, 在深層特徵圖上設立較大的priorbox來負責檢測大物體。
·正、 負樣本的選取與損失計算: 利用3×3的卷積在6個特徵圖上進行特徵的提取, 並分為分類與回歸兩個分支, 代表所有預選框的**值, 隨後進行預選框與真實框的匹配, 利用iou篩選出正樣本與負樣本, 最終計算出分類損失與回歸損失。
單次目標檢測器 YOLO簡介
yolo 在卷積層之後使用了 darknet 來做特徵檢測。然而,它並沒有使用多尺度特徵圖來做獨立的檢測。相反,它將特徵圖部分平滑化,並將其和另乙個較低解析度的特徵圖拼接。例如,yolo 將乙個 28 28 512 的層重塑為 14 14 2048,然後將它和 14 14 1024 的特徵圖拼接。之...
DIY乙個粒子檢測器 2020 10
在tle207x低雜訊高速jfet 輸入運算放大器的雜訊特性測量中實現了tle207x的低雜訊放大器。放置在金屬盒遮蔽盒內進行訊號放大。基於上面的實驗電路,diy乙個粒子檢測器。其中bpx61來自 店bpx61.用於實驗的放射源來自離子煙霧感測器中的am241。實驗中的感測器和放射源 實驗電路採用在...
如何正確訓練乙個 SVM HOG 行人檢測器
這幾個月一直在忙著做大 乙個基於 svm 的新的目標檢測演算法。為了做效能對比,我必須訓練乙個經典的 dalal05 提出的行人檢測器,我原以為這個任務很簡單,但是我錯了。為了訓練出乙個效能達標的行人檢測器,我花了半個月的時間,中間遇到各種 bug 我就不提了,下面只說正確的步驟。基於 matlab...