神經網路中的卷積是指用乙個卷積核(也叫濾波器),實質上是乙個矩陣,在影象上掃瞄一遍,得到乙個新的影象。掃瞄的實質,就是矩陣大小的影象畫素值,和卷積核做運算,然後得到新的畫素值,放到新的影象中
運算不是一行乘一列的乘法,而是哈達馬積,即對應位置的元素一一相乘。最後,把哈達馬積得到的矩陣上的每乙個元素求和,得到最終的畫素值。因此,每個神經元輸入為影象的一小塊和卷積核,輸出為乙個數值
選擇合適的卷積核,可以突出影象的關鍵資訊。例如,這個卷積核說明每個畫素會在原有值上增加八倍,在減去相鄰的一圈的畫素點。因為背景顏色相近,以綠色為主,所以處理後得到的影象基本為黑色。而鹿和背景交界處相差較大,所以為白色曲線
卷積神經網路經常用於影象處理。在其他神經網路中,輸入往往是向量,權值也是向量。而卷積神經網路中,輸入是乙個巨大的矩陣,每個神經元負責大矩陣上的一小塊,即影象的灰度矩陣,權值是卷積核,輸出是一系列數值拼起來的小矩陣
如圖,區域性感知即只關注新影象這個位置附近的畫素點。這樣可以有效的提取影象特徵而且不會讓計算量過大。
卷積核會掃瞄整個影象,做卷積運算,得到新的影象。
掃瞄時,卷積核一般每次只移動一格,即步長為1。
例如,假設影象大小為4*4,卷積核大小為2*2,那麼卷積運算不是4次,而是3*3=9次,因為每行移動兩次,計算三次,總共有三行
當然,也可以選擇其他步長。例如上面的例子如果選擇2,那麼就是2*3=6次,因為行還是三行,但每一行只需要計算兩次。
在處理影象時,可以選擇多個卷積核,生成不同的影象。這些不同影象可以理解為不同通道
卷積是令影象的每一小塊與卷積核做哈達馬積然後求結果矩陣的每個元素之和。而池化就是對影象的每一小塊做其他處理,這些處理可以是取最大,取平均。
處理方式依然是用滑動視窗掃瞄一遍,只不過這次不需要其他矩陣配合了。
優點:可以對影象降維, 克服過擬合,在影象識別領域,池化還能提供平移和旋轉不變性。
經過多次卷積或池化處理後,影象可以獲知到影象的低階資訊,然後通過低階資訊,不斷拼接處高階資訊,最後得到最終結果。就像盲人摸象,先通過底層特徵,得到這是腿,這是象鼻,這是尾巴等,再通過判斷這些特徵的大小,位置等判斷出這是大象的概率相對最高。
在卷積神經網路中,降取樣層一般就是池化操作。
卷積神經網路 卷積層
1 2 該部落格主要是對網上知識點的學習和整理,方便日後複習。侵刪。卷積神經網路 cnn 一般由輸入層 卷積層 啟用函式 池化層 全連線層組成,即input 輸入層 conv 卷積層 relu 啟用函式 pool 池化層 fc 全連線層 當我們給定乙個 x 的圖案,計算機怎麼識別這個圖案就是 x 呢...
卷積神經網路膨脹卷積
卷積核就是影象處理時,給定輸入影象,輸入影象中乙個小區域中畫素加權平均後成為輸出影象中的每個對應畫素,其中權值由乙個函式定義,這個函式稱為卷積核 又稱濾波器。卷積核的大小一般有1x1,3x3和5x5的尺寸 一般是奇數x奇數 同樣提取某個特徵,經過不同卷積核卷積後效果也不一樣 可以發現同樣是銳化,5x...
卷積神經網路 卷積操作
對於cnn,卷積操作的主要目的是從輸入影象中提取特徵。卷積通過使用輸入資料的小方塊學習影象特徵來保留畫素之間的空間關係。卷積操作就是卷積核 過濾器 filter 在原始中進行滑動得到特徵圖 feature map 的過程。假設我們現在有乙個單通道的原始和乙個卷積核,卷積的過程如圖2所示 卷積得到的特...