**題目:feature pyramid networks for objection detection
**: github 可搜
作者在文中指出了一種基於特徵金字塔結構的目標檢測演算法,但是骨幹網路結構還是基於faster-rcnn。
上圖便是作者在文中指出的特徵金字塔的bottom-up,top-down結構。將bottom-up中涉及到的feature map
依據先後順序依次命名為[c2, c3, c4,c5],top-down部分涉及的依次命名為[p2, p3, p4, p5]。
當通過rpn時,各層的特徵可通過乙個共享權重的rpn網路後者,各自獨有的rpn網路,這裡便涉及到
乙個問題,那就是在訓練rcnn時如何通過proposal 找到對應的feature map。文中給出了乙個解決方案,
具體計算公式如下:
**:
levels = tf.round(4. + tf.log(tf.sqrt(w*h + 1e-8)/224.0) / tf.log(2.))
levels = tf.maximum(levels, tf.ones_like(levels) *
(np.float32(self.min_level))) # level minimum is 2
levels = tf.minimum(levels, tf.ones_like(levels) *
(np.float32(self.max_level)))
**中的4是針對resnet網路結構的引數,224是輸入的尺寸。
後面便是對rcnn網路的具體訓練了,值得注意的是:這一部分的訓練引數是在rpn中的所有
proposal中根據一定的batch size和正負樣本的比例以及iou值進行取樣的。詳細部分可參照faster
-rcnn部分。
小目標檢測 特徵金字塔網路(FPN)
feature pyramid networks for object detection 3.核心思想 引用 a 影象金字塔對原圖對原圖進行上取樣和下取樣得到不同尺度的影象,然後分別對不同尺度的影象做卷積得到特徵圖 feature map 這樣做明顯很耗時。b 只用到了最高層的特徵,越高層特徵圖語...
溫故知新 目標檢測中的FPN
類似影象金字塔,在 筆記中記錄的一樣,模擬人的視覺,從遠到近觀察物體 頂部 低解析度 檢測到的是尺寸更大的物體 底部 高解析度 檢測到的是尺寸更小的物體 橙色框代表,一般由resize 下取樣操作產生 藍色框代表特徵圖,通過卷積產生,越粗的框代表語義越深。a 多維度輸入,多維度特徵圖 影象金字塔,不...
Win10跑FPN網路填坑日誌
windows下想要執行faster rcnn等網路首先就是要編譯lib資料夾下的setup.py 建立cython模組。在訓練fpn模型前需要建立fast rcnn環境。cd到lib目錄下執行 python setup.py build ext inplace python setup.py bu...