基於深度學習的 目標檢測 演算法綜述

2021-08-19 11:36:49 字數 968 閱讀 3200

三部曲,這樣就有兩個難以解決的問題;其一是區域選擇的策略效果差、時間複雜度高;其二是手工提取的特徵魯棒性較差。

傳統的區域選擇使用滑窗,每滑乙個視窗檢測一次,相鄰視窗資訊重疊高,檢測速度慢。r-cnn 使用乙個啟發式方法(selective search),先生成候選區域再檢測,降低資訊冗餘程度,從而提高檢測速度。

傳統的手工提取特徵魯棒性差,限於如顏色、紋理等低層次(low level)的特徵。

先生成候選區域,再對區域進行卷積,這裡有兩個問題:其一是候選區域會有一定程度的重疊,對相同區域進行重複卷積;其二是每個區域進行新的卷積需要新的儲存空間。

high resolution classifier 448*448 pretrain

convolution with anchor boxes

dimension clusters

multi-scale training every 10 batch

direct location prediction

fine-grained features

spp net 「spatial pyramid pooling in deep convolutional networks for visual recognition」

fast r-cnn 「fast r-cnn」

faster r-cnn 「faster r-cnn: towards real-time object detection with region proposal networks」

mask r-cnn 「mask r-cnn」

yolo 「you only look once: unified, real-time object detection」

ssd 「ssd: single shot multibox detector」

yolo9000 「yolo9000: better, faster, stronger」

目標檢測演算法綜述

1.傳統的目標檢測框架,主要包括三個步驟 1 利用不同尺寸的滑動視窗框住圖中的某一部分作為候選區域 2 提取候選區域相關的視覺特徵。比如人臉檢測常用的harr特徵 行人檢測和普通目標檢測常用的hog特徵等 3 利用分類器進行識別,比如常用的svm模型 2.目標檢測領域的深度學習方法主要分為兩類 對於...

基於深度學習關鍵點檢測演算法綜述

關鍵點檢測是計算機視覺中比較重要的任務之一,當前主流的演算法可總結如下 1 基於coordinate 即將卷積神經網路 cnn 的特徵通過乙個全連線層來回歸關鍵點的座標和對應的置信度資訊,在對卷積 特徵的利用上,逐漸由單層特徵到金字塔特徵轉換,有代表性的演算法為人臉關鍵點檢測的pfld演算法,全稱為...

基於深度學習的目標檢測演算法 SSD

ssd single shot multibox detector 問題引入 目前,常見的目標檢測演算法,如faster r cnn,存在著速度慢的缺點。該 提出的ssd方法,不僅提高了速度,而且提高了準確度。ssd 該 的核心思想 該 的主要貢獻 1.提出了ssd目標檢測方法,在速度上,比之前最快...