小目標檢測 特徵金字塔網路(FPN)

2021-10-05 21:41:18 字數 1492 閱讀 6875

**:feature pyramid networks for object detection

3. 核心思想

引用

(a)影象金字塔對原圖對原圖進行上取樣和下取樣得到不同尺度的影象,然後分別對不同尺度的影象做卷積得到特徵圖(feature map),這樣做明顯很耗時。

(b)只用到了最高層的特徵,越高層特徵圖語義資訊越豐富,但是解析度會降低,這樣網路會不可避免的忽略小目標,比如r-cnn,fast r-cnn、faster r-cnn等檢測不出小目標。

(c)直接在不同尺度的特徵圖上做**,沒有上取樣過程,比如ssd(single shot detector)。因為網路是在原有的特徵圖上做**的,所以不會增加額外的計算開銷,但是作者認為ssd還是沒有用到足夠底層的特徵,越底層的特徵對小目標的檢測越有幫助。

(d)作者提出的方法,將高層特徵做上取樣增大特徵圖的尺度,然後將同尺度的特徵圖進行融合得到新的特徵圖,最後在這些新的特徵圖上做**,這樣網路就既能用到高層特徵的語義資訊,也能用到底層特徵的位置資訊。

金字塔的構建包括自下而上的通道,自上而下的通道和橫向連線三部分。

這是資料向上流動的過程。特徵圖在經過某些層後會改變大小,比如步長為2的卷積層和池化層,當然,在經過某些比如rule之類的啟用層時候不會改變大小,作者將同尺度的特徵圖稱為金字塔的乙個階(stage)。

這是資料向下流動的過程。對頂層特徵圖做上取樣增大特徵圖的尺寸,使其和底層特徵圖尺寸相同,然後將同尺寸的底層特徵圖和頂層特徵圖進行融合以消除上取樣後的混疊效應(失真,小目標的位置可能會發生改變)

橫向連線是將底層特徵圖和頂層特徵圖融合的方法。用1×1

1\times1

1×1卷積改變自下而上通道上特徵圖的通道數(圖3左上),使其和自上而下通道上特徵圖的通道數一致(圖3右上),最後對同階的特徵圖相加進行融合,這樣就消除了上取樣的混疊效應。

卷積神經網路由淺到深,語義資訊越來越豐富,但特徵圖越來越小,解析度越來越低,解決方案是接將淺層和高層的特徵圖連線起來,將淺層的資訊傳遞到深層,以解決深層特徵圖容易忽略小目標的問題。

fpn特徵金字塔網路解讀

fpn:feature pyramid networks for object detection

fpn(特徵圖金字塔網路)理論基礎與具體實現

fpn–2017 cvpr解讀

影象混疊現象

怎樣設定目標(一) 目標金字塔

目標對我們的成功至關重要,可知道目標的重要意義並沒用。當你想要執行某項行動時,制定目標就是第一步。如果你想要乙個懶人動起來,與其打他罵他,不如給他乙個強大的目標,促使他行動。目標就是動力,目標就是方向,制定目標應該成為我們生活的一種習慣,怎麼制定我們的目標呢?1984年,在東京國際馬拉松邀請賽中,名...

常見的四種特徵金字塔網路結構

為什麼使用特徵金字塔呢,是因為cnn對物體的平移是保持不變的,而對於物體的尺度變換是無法處理的,所以使用特徵金字塔進行處理,下面進行介紹。對影象做乙個特徵金字塔,在每乙個影象上做cnn,進行 但 計算與記憶體開銷太大。對影象做乙個cnn,相當於乙個特徵金字塔,不對影象做特徵金字塔,在最高層做乙個 但...

php小練習 實現幾種不同的金字塔

首先,從簡單的著手,列印出金字塔的右半部分,如下 n 5 金字塔行數 外層的for迴圈控制層數 for i 1 i n i echo 每一層列印完換行 然後列印出完整的金字塔,完整的金字塔,在上面的基礎下只需要做小小的修改,n 5 金字塔行數 for i 1 i n i 內層控制每層 的個數 注 把...