目標檢測中的Anchor

2021-10-09 23:26:34 字數 1319 閱讀 8877

前言:

在計算機視覺四大基本任務(檢測、分類、定位、分割)中,影象的目標檢測受到的了研究者們越來越多的關注。今天我們就來聊一聊在目標檢測中一項重要的機制——anchor。anchor機制在凱明大神提出的faster-rcnn(2023年提出)時興起。下面將從三方面來敘述anchor.

目錄1.什麼是anchor 在目標檢測任務中,輸入影象經過骨幹網路提取得到特徵圖,該圖上的每個畫素點,即為anchor錨點;或者說在feature map使用滑動視窗的操作方式,當前滑窗的中心在原畫素空間的對映點就稱為anchor;簡單來說rpn(reg ion proposal network)依靠乙個在共享特徵圖上滑動的視窗,為每個位置(即:anchor)生成9種預先設定好長寬比與面積的目標框。這9種初始anchor包含三種面積(128×128,256×256,512×512),每種面積又包含三種長寬比(1:1,1:2,2:1),即 anchor boxes。示意圖如下所示:

2.anchor的機制 以每個anchor為中心點,人為設定不同的尺度(scale)和長寬比(aspect ratio),即可得到基於anchor的多個anchor box,用以框定影象中的目標,這就是所謂的anchor 機制。如下圖所示,左側顯示了基於乙個anchor點生成的9個anchor boxes(紅、綠、藍三種顏色),右側顯示了該特徵圖上密集分布的所有anchor boxes。

3.anchor的優缺點 在知道了anchor的原理和機制之後,下面我們就來講講anchor的優缺點了:

3.1 anchor的優點:

① 使用anchor機制產生密集的anchor boxes,使得網路可直接在此基礎上進行目標分類及邊界框座標回歸;

② 密集的anchor boxes可有效提高網路目標召回能力,對於小目標檢測來說提公升非常明顯。

3.2 anchor的缺點:

① anchor機制中,需要設定的超參:尺度(scale)和長寬比( aspect ratio)是比較難設計的。這需要較強的先驗知識。

②冗餘框非常之多:一張影象內的目標畢竟是有限的,基於每個anchor設定大量anchor boxes會產生大量的easy-sample,即完全不包含目標的背景框。這會造成正負樣本嚴重不平衡問題,也是one-stage演算法難以趕超two-stage演算法的原因之一。

③網路實質上是看不見anchor boxes的,在anchor boxes的基礎上進行邊界回歸更像是一種在範圍比較小時候的強行記憶。

目標檢測 anchor的生成

兩個名詞 目標的真實邊界 ground truth bounding box 而以畫素為中心生成多個大小和寬高比 aspect ratio 的邊界框,稱為anchor box。基於深度學習的目標檢測不使用傳統的滑窗生成所有的視窗作為候選區域,fasterrcnn提出的rpn網路,處理較少但準確的候選...

目標檢測中的example mining

目標檢測,一般分為2個部分,定位和分類,example mining是選擇出特定樣本來計算損失函式 從實際問題出發hard example應該就是指定位較困難或分類較困難或者兩者都困難的候選框。ssd的caffe中支援negative mining和hard example mining,當shar...

目標檢測中region proposal的作用

首先我們明確乙個定義,當前主流的object detection框架分為1 stage和2 stage,而2 stage多出來的這個stage就是regional proposal過程,明確這一點後,我們繼續講。regional proposal的輸出到底是什麼?我們首先看一下以faster r c...