卷積神經網路學習筆記與心得(3)卷積

2022-09-13 11:48:11 字數 772 閱讀 2115

數字影象是乙個二維的離散訊號,對數字影象做卷積操作其實就是利用卷積核(卷積模板)在影象上滑動,將影象點上的畫素灰度值與對應的卷積核上的數值相乘,然後將所有相乘後的值相加作為卷積核中間畫素對應的影象上畫素的灰度值。

從卷積的效果來看,在二維影象上進行卷積時,卷積核對所在區域上符合某種條件的畫素賦予較多的權重,其他的畫素賦予的權重較少,這可以看作是一種濾波行為,因此卷積神經網路的卷積核有時也被稱為濾波器,卷積核所在區域被稱為區域性感知域。若區域性感知域中存在畫素符合加較大權重的條件,稱這些畫素具有某種特徵,或稱卷積核捕捉到了某種特徵。

上圖展示了乙個3*3卷積核對5*5進行卷積後得到的結果。原圖為乙個「十」字圖形,卷積核的中間列為1,其餘元素為0,結果顯示,原圖中間那一列得到了加強,從直觀上說,原圖的中心位置在垂直方向上具有連續畫素的特徵,而卷積核捕捉到了這個特徵。

如果原圖的中間那一列發生了平移,卷積核依舊可以捕捉到這個特徵(可能需要對原圖的周邊進行填充),或者說卷積操作的結果與特徵在圖中的位置沒有關係,這是卷積神經網路對影象平移具有抗性的基礎,當使用更大尺寸的影象和卷積核時,卷積神經網路還能夠在一定程度上保持對旋轉和透視變換的不敏感性。

在卷積神經網路流行之前,有使用gabor濾波器+svm的識別模型,二維影象上的gabor濾波也是以卷積方式實現的,與卷積神經網路不同的是,gabor+svm模型使用svm作為分類器,卷積神經網路使用傳統神經網路作為分類器,最重要的一點是gabor核需要人為設計,而卷積神經網路的卷積核通過反向傳播學習得來,這使得卷積神經網路可以學習到人無法設計的特徵,配合啟用函式,可以給模型帶來表達非線性特徵的能力,進一步提公升模型的效能。

學習筆記 卷積神經網路(3)

實現卷積神經網路 1.訓練集不僅包含神經網路需要 的物件分類標籤,還包含表示邊界框 bounding box 的四個數字 邊界框的中心點,框長和框寬 example 1.pedestrian 2.car 3.motorcycle 4.background need to output bx,by b...

卷積神經網路學習1 卷積層

卷積神經網路常用於計算機視覺當中,應用在計算機視覺當中,就要面臨乙個挑戰,那就是輸入資料非常的大,假如輸入乙個1000 1000的,那麼他就有1000 1000 3 的rgb三通道 個資料,對於300w的資料量,那麼當我們第乙個隱藏層有1000個神經元進行全連線時,那麼將會有300w 1000個引數...

卷積神經網路學習筆記與心得(4)池化

經過卷積 啟用後的結果一般帶有大量原圖資訊。上圖中卷積核提取的是豎直方向上的連續畫素,但是,被增強的畫素只佔了結果的1 3,對於多層網路,其餘重要性較低的資訊也被傳入了下一層網路,造成了不必要的浪費,因此需要用池化對卷基層得到的結果做聚合統計。池化的理論基礎是 影象相鄰位置的畫素是相關的,即使間隔一...