關於感受野的理解與計算

2021-10-01 23:47:50 字數 1102 閱讀 5058

在卷積神經網路中,感受野(receptive field)的定義是卷積神經網路每一層輸出的特徵圖(feature map)上每個畫素點在原始影象上對映的區域大小,這裡的原始影象是指網路的輸入影象,是經過預處理(如resize,warp,crop)後的影象。

神經元之所以無法對原始影象的所有資訊進行感知,是因為在卷積神經網路中普遍使用卷積層和pooling層,在層與層之間均為區域性連線。

神經元感受野的值越大表示其能接觸到的原始影象範圍就越大,也意味著它可能蘊含更為全域性,語義層次更高的特徵;相反,值越小則表示其所包含的特徵越趨向區域性和細節。因此感受野的值可以用來大致判斷每一層的抽象層次.

如圖所示7*7的原始影象,經過kernel_size=3, stride=2的conv1,kernel_size=2, stride=1的conv2後,輸出特徵圖大小為2 * 2,很明顯,原始影象的每個單元的感受野為1,conv1的每個單元的感受野為3,而由於conv2的每個單元都是由2 * 2範圍的conv1構成,因此回溯到原始影象,每個單元能夠看到5 * 5大小的區域範圍。

但由於conv1層對輸入卷積時存在重疊部分,所以conv2層的特徵單元感受野小於6,該重疊部分為:

k_1 * r_0 - s_1 * r_0 = r_1 - s_1 = 1

而對於conv3層,其輸出特徵單元最大感受野為:

k_3 * r_2 = 2 * 5 = 10

又因為conv2層對其輸入特徵圖進行卷積時也存在重疊部分,所以conv3層的特徵單元感受野小於10,此時重疊部分為:

因此對於卷積神經網路,其感受野計算有如下規律:

感受野計算

這兩篇部落格各有優缺點,我結合自己的理解分析一下。概念 感受野 receive field 是指當前feature map中的乙個原子點p與輸入層中多少個原子個數相關的問題,假設輸入層相關的點為 rf rf 個 假設長寬兩個方向上做同樣尺度的操作 即輸入層中rf rf個原子值的變化會影響當前feat...

感受野計算

定義 感受野 receptive field 指的是神經網路中神經元 看到的 輸入區域,在卷積神經網路中,感受野的定義是卷積神經網路每一層輸出的特徵圖 feature map 上的畫素點在原始影象上對映的區域大小。計算方式 l k lk 1 f k 1 i 0k 1 si l k l f k 1 p...

感受野的計算

感受野 receptive field 指的是神經網路中神經元 看到的 輸入區域,在卷積神經網路中,feature map上某個元素的計算受輸入影象上某個區域的影響,這個區域即該元素的感受野。卷積神經網路中,越深層的神經元看到的輸入區域越大,如下圖所示,kernel size 均為3 33 3,st...