深度學習(七)object detection

2022-04-11 16:41:21 字數 1482 閱讀 8474

目標檢測(object detection)的基本思路: 檢測(detection)+ 定位(localization)

目標檢測在很多場景有用,如無人駕駛和安防系統。

特徵提取演算法(如:haar特徵,hog特徵)+分類器(如:svm)

selective search to extract regions + cnn提取特徵 + svm分類

主要步驟:

(1) 輸入測試影象

(2) 利用selective search演算法在影象中提取2000個左右的region proposal。

(3) 將每個region proposal縮放(warp)成227x227的大小並輸入到cnn,將cnn的fc7層的輸出作為特徵。

(4) 將每個region proposal提取到的cnn特徵輸入到svm進行分類。

去掉了單獨svm分類的部分,直接用cnn的網路實現分類

fast r-cnn在整個上使用cnn,然後對特徵對映使用「興趣區域」 (region of interest, roi) 池化,最後使用前饋網路進行分類和回歸。

主要步驟:

(1)在影象中確定約1000-2000個候選框 (使用選擇性搜尋)

(2)對整張輸進cnn,得到feature map

(3)找到每個候選框在feature map上的對映patch,將此patch作為每個候選框的卷積特徵輸入到spp layer和之後的層

(4)對候選框中提取出的特徵,使用分類器判別是否屬於乙個特定類

(5)對於屬於某一特徵的候選框,用回歸器進一步調整其位置

faster-rcnn新增了區域提案網路 (region proposal network, rpn),擺脫了選擇性搜尋演算法,並可以做到端到端的訓練。

rpns的任務是基於objectness分數輸出物件,然後用roi池化 (roi pooling) 和完全連線層分類。

主要步驟:

(1)對整張輸進cnn,得到feature map

(2)卷積特徵輸入到rpn,得到候選框的特徵資訊

(3)對候選框中提取出的特徵,使用分類器判別是否屬於乙個特定類

(4)對於屬於某一特徵的候選框,用回歸器進一步調整其位置

ssd演算法是一種直接**目標類別和bounding box的多目標檢測演算法。與faster rcnn相比,該演算法沒有生成 proposal 的過程,這就極大提高了檢測速度。

深度學習七

我看到過的最複雜的模型就是ssd了,應該說在object detection這個領域,大牛們都是一再的奮鬥著 努力著。一路飄過,聽到的模型真的有很多,但是我覺得有質的變化還應該是r cnn spp fast rcnn faster rcnn yolo,為什麼會是這樣呢,我感覺其實如果是但一物體的識別...

深度學習物體檢測(七) SSD

yolo 模型每個網格只 乙個物體,容易造成漏檢 對於物體的尺度相對比較敏感,對於尺度變化較大的物體泛化能力較差。針對 yolo 中的不足,提出的 ssd single shot multibox detector 方法同時兼顧了 map 和實時性的要求。對於輸入影象大小為 300 300 在 vo...

深度學習總結 七 調參經驗

觀察loss勝於觀察準確率,loss設計要合理,對比訓練集和驗證集的loss relu可以很好的防止梯度瀰散問題,當然最後一層的啟用函式千萬慎用relu,如果是分類的用softmax batchnorm可以大大加快訓練速度和模型效能 dropout防止過擬合,可直接設定為0.5,即一半一半,測試的時...