1.r-cnn:
使用selective search方法先產生region proposals,再使用淺層cnn網路進行特徵提取,最後使用svm進行分類。這篇**裡提及的乙個點,就是關於bbox的回歸方法。由於使用selective search方法提取的每乙個region都進行一次前向卷積操作,因此r-cnn方法非常耗時,不適於實際檢測使用。
2.spp-net:
針對r-cnn多次使用cnn提取特徵,有重複計算的弊端,spp-net提出的方法是,在原圖上只提取一次特徵,然後採用對映的方式,找到region在feature map上的對映區域,再將該區域送到分類器(spp-net使用的依然是svm)中進行訓練。另外,spp-net所設計的網路架構(spp)可以處理任意尺寸的輸入,而不需要像r-cnn那樣,需要事先對region進行crop/warp操作。
結果顯示,由於提取特徵時可以共享特徵,該方法相較於r-cnn,繼降低了耗時,也提公升了檢測精度。
3. fast r-cnn:
這篇文章綜合考慮了r-cnn和spp-net的優缺點,網路設計了一種roi pooling layer(其實就是1個level的spp)。這篇文章主要的共享是,將bbox回歸和cls回歸放在一起處理。
4. faster r-cnn
提出了rpn網路,能夠自己學習產生region proposals。實際上就是rpn+fast r-cnn。
1.yolo & yolov2
(1)邊框定位不夠精準,尤其是小目標
(2)目標檢出率低,尤其是小目標
(3)誤報少
(4)耗時少
2. ssd
(1)邊框定位準
(2)目標檢出率高
(3)誤報相較yolo多
(4)耗時多
3. faster- rcnn
(1)邊框定位準
(2)目標檢測率高
(3)耗時高
(4)訓練時間長
(5)誤報相較yolo高
目標檢測方法效果小結
使用selective search方法先產生region proposals,再使用淺層cnn網路進行特徵提取,最後使用svm進行分類。這篇 裡提及的乙個點,就是關於bbox的回歸方法。由於使用selective search方法提取的每乙個region都進行一次前向卷積操作,因此r cnn方法非...
目標檢測和跟蹤小結
目標檢測即為從序列影象中將變化區域從背景影象中提取出來。運動目標檢測的演算法依照目標與攝像機之間的關係可以分為靜態背景下運動檢測和動態背景下運動檢測。1.靜態背景 2.動態背景 需要進行影象的全域性運動估計與補償 運動目標跟蹤就是在一段序列影象中的每幅影象中實時地找到所感興趣的運動目標 包括位置 速...
目標檢測 Two Stage方法
two stage流程如下 整體流程介紹 1 用主幹網路 如vgg網路等 對原進行特徵提取處理,對應流程圖中的input conv pooling以及中的conv layers立方體塊 因為主幹網路是多層的conv與pooling層的結合 生成feature map特徵圖。2 通過rpn網路,對主幹...