一、傳統的目標檢測一般使用滑動視窗的框架,主要包括三個步驟:
利用不同尺寸的滑動視窗框住圖中的某一部分作為候選區域;
提取候選區域相關的視覺特徵。比如人臉檢測常用的harr特徵;行人檢測和普通目標檢測常用的hog特徵等;
利用分類器進行識別,比如常用的svm模型。
基於深度學習的目標檢測分為兩派:
基於區域提名的,如r-cnn、spp-net、fast r-cnn、faster r-cnn、r-fcn;
端到端(end-to-end),無需區域提名的,如yolo、ssd。
目前來說,基於區域提名的方法依然佔據上風,但端到端的方法速度上優勢明顯,後續的發展拭目以待。
接下來是對相關研究的詳細介紹。
1、首先介紹的是區域提名--選擇性搜尋,以及用深度學習做目標檢測的早期工作--overfeat。
選擇性搜尋:不斷迭代合併候選區域,已被棄用。
overfeat: 用cnn做分類、定位和檢測的經典之作(馬克一記)。
2、基於區域提名的方法:主要介紹r-cnn系列
r-cnn:之前的工作都是用滑動視窗的方式,速度很慢,r-cnn採用的是selective search。
它和overfeat類似,但缺點是速度慢。
spp-net:針對剪裁技術可能出現的問題,spp不管是對整副影象還是裁剪後的影象,都提取相同維度的特徵,這樣可以統一送至全連線層。
fast r-cnn:主要解決2000個候選框帶來的重複計算問題。
faster r-cnn:拋棄了selective search,引入了rpn網格。
r-fcn:將最後的全連線層換為了卷積層。
3、端到端(end-to-end):無需區域提名
yolo:將448*448的影象分成s*s的網路,簡化目標檢測流程;
ssd: yolo的改進,分為兩部分:影象分類的網路和多尺度特徵對映網路。
目標檢測還存在一些問題,比如小目標檢測問題。
二、r-fcn、ssd、yolo2、faster-rcnn和labelimg實驗筆記
labelimg:
目標檢測資源收集彙總
今年以來讀過的object detection資源列表如下 41 從r cnn到rfbnet,深度目標檢測5年縱覽,文章 讓你從入門到精通 46 學界 eccv 2018最佼佼者的目標檢測演算法 48 收藏 目標檢測網路學習總結 rcnn yolo v3 52 edgeboxes,邊緣檢測在sppn...
目標檢測資源彙總 持續更新
目標檢測資源彙總 持續更新 實戰專案 支援剪枝 量化和知識蒸餾的yolov3 特性 1 提供多個主流目標檢測資料集的預處理後檔案及訓練方法。2 提供包括剪枝,量化,知識蒸餾的主流模型壓縮演算法實現。3 提供多backbone訓練目前包括darknet yolov3,tiny yolov3,mobil...
目標檢測演算法彙總比較
很難衡量乙個檢測演算法的好壞,因為除了演算法本身的思路之外,還有許多因素影響它的速度和精度,比如 為了對比不同的演算法,可以不考慮上述的所有影響因素,直接對 結果評測,應該能大體看出不同方法的速度差異。上圖是乙個所有方法的預覽。從圖中可以看出rfcn的準確度是最高的。上圖可以看出,速度最快的還是yo...