FPN學習筆記

2021-08-31 09:52:34 字數 987 閱讀 6578

關鍵創新點:多尺度**,提高精度同時避免了傳統的多尺度方法(image pyramid)的巨大開銷。

1,bottem-up:從低到上的特徵提取部分,輸入為原始,輸出一系列不同尺度的feature map。**中使用resnet網路,把resnet每個stage的最後乙個feature map作為輸出。**中只使用conv2、conv3、conv4、conv5 四個stage,並把輸出記為c2、c3、c4、c5。分別相對於原始縮小4、8、16、32倍。

2,top-down和lateral connection:top-down的作用是,通過上取樣把那些更上層的feature map(位置粗糙但語義豐富)轉化為解析度更高的feature map,這樣是為了和較低層的feature map大小相匹配。然後,lateral connection會將相同解析度的top-down生成的feature map(更豐富的語義資訊)和bottem-up生成的feature map(更豐富的位置資訊)結合。

3,上取樣方式:上取樣因子是2,因為c2到c3到c4到c5正好每次縮小2倍。方法採用最臨近元法(nearest neighbor upsampling)。

4,lateral connection 方式:先對bottom-up輸出進行乙個1×1卷積(目的降低維度),然後通過element-wise addition,和上取樣輸出融合。融合的結果作為下層的輸入,依次迭代迴圈,直到產生最大解析度的feature map。

5,迭代的最開始,直接對c5進行1×1卷積產生第乙個feature map。

6,top-down產生的4個feature map,都要進行乙個3×3的卷積(為了降低混疊效應)。這4個最終的feature map記為p2、p3、p4、p5對應c2、c3、c4、c5。解析度對應相等。

7,**中提到把除了基礎網路外所有的feature map的dimension固定為256,有待理解。。。

FPN 相關問題

目錄 1 fpn橫向連線為什麼接乙個3 3 卷積 2 fpn的特徵融合為什麼是相加操作 3 fpn整體架構 4 為什麼fpn能夠很好的處理小目標?fpn特徵金字塔網路解讀 橫向連線 lateral connection 的步驟 對第 n 層的特徵使用 1 1 卷積來修改通道數 對第 n 1 層的特徵...

FPN 檢測網路解析

題目 feature pyramid networks for objection detection github 可搜 作者在文中指出了一種基於特徵金字塔結構的目標檢測演算法,但是骨幹網路結構還是基於faster rcnn。上圖便是作者在文中指出的特徵金字塔的bottom up,top down...

關於FPN的三個疑問

cvpr 現場提問 1 不同深度的 feature map 為什麼可以經過 upsample 後直接相加?a 作者解釋說這個原因在於我們做了 end to end 的 training,因為不同層的引數不是固定的,不同層同時給監督做end to end training,所以相加訓練出來的東西能夠更...