卷積神經網路(三)

2021-09-26 18:13:26 字數 1539 閱讀 7279

六、三維卷積

在經歷了二維灰度圖的卷積操作之後,如何進行三維卷積(rgb影象)呢?我們一起來看下!

首先我們還是給出乙個6*6的影象,不過因為有rgb三個通道,所以影象變成了6*6*3。同樣的,在二維灰度圖中3*3的卷積核也要相應的更改為3*3*3的卷積核。我們將表示式寫出如下:

最終給出的結果是4*4*1的影象(注意不是4*4*3的影象)。

接下來解釋一下3個數字的含義,以輸入6*6*3為例。

第乙個引數6是指的高度,第二個引數6是指的寬度,第三個引數3是指通道的數量。

注意:影象中的通道數和卷積核的通道數必須一致。

為了簡化,在**中或者各種模型搭建中卷積核我們一般用立方體表示。畫成如下:

那麼如何計算這個3*3*3卷積核的輸出呢?

類似對於二維灰度圖的處理方法,我們將這個3*3*3的卷積核先放到最左上角的位置:

這個3*3*3的卷積核有27的引數,依次取紅綠藍三色通道中的數字與之對應引數相乘結果求和。得到的結果就是4*4矩陣的第乙個數字。如果要計算下乙個輸出,我們就需要將這個立方體向右滑動一位,然後做同一種計算。不斷移動卷積核的位置,得到輸出。其本質思想和二維的處理一樣,都是卷積的思想,只不過多了三個維度。

那麼這樣子有什麼作用呢?舉個例子,如果你想檢測紅色邊緣的通道,那麼你的3*3*3的卷積核可以這麼設定:

這樣子疊在一起的卷積核就是乙個只對紅色通道有用的檢測垂直邊界的卷積核。

如果想對三個通道同時檢測,那麼其對應的卷積核都進行處理,如下:

當我們設定不同的引數的時候我們就可以得到不同的特徵檢測器。

例如當我們想做45°或者70°傾斜的邊緣時候我們又該怎麼做呢?答案很簡單,就是引入多個卷積核,如下圖所示。

對於每乙個卷積層我們設定不同的引數去進行我們想要的特徵提取。例如第乙個可以是乙個水平邊緣檢測器,第二個可以是乙個垂直邊緣檢測器。卷積之後我們得到乙個4*4*2的立方體,這裡的2**於我們使用了兩個不同的卷積核。

最後總結一下:

如果有乙個

將其轉化為公式的形式:

其中當然這個是在步幅為1和padding為0的情況下成立的,上述這麼寫並不是那麼嚴謹。那麼什麼是步幅和padding呢?我們將在下一節說一下這些概念。

神經網路 卷積神經網路

這篇卷積神經網路是前面介紹的多層神經網路的進一步深入,它將深度學習的思想引入到了神經網路當中,通過卷積運算來由淺入深的提取影象的不同層次的特徵,而利用神經網路的訓練過程讓整個網路自動調節卷積核的引數,從而無監督的產生了最適合的分類特徵。這個概括可能有點抽象,我盡量在下面描述細緻一些,但如果要更深入了...

神經網路 卷積神經網路

1.卷積神經網路概覽 來自吳恩達課上一張,通過對應位置相乘求和,我們從左邊矩陣得到了右邊矩陣,邊緣是白色寬條,當畫素大一些時候,邊緣就會變細。觀察卷積核,左邊一列權重高,右邊一列權重低。輸入,左邊的部分明亮,右邊的部分灰暗。這個學到的邊緣是權重大的寬條 都是30 表示是由亮向暗過渡,下面這個圖左邊暗...

卷積神經網路 有趣的卷積神經網路

一 前言 最近一直在研究深度學習,聯想起之前所學,感嘆數學是一門樸素而神奇的科學。f g m1 m2 r 萬有引力描述了宇宙星河運轉的規律,e mc 描述了恆星發光的奧秘,v h d哈勃定律描述了宇宙膨脹的奧秘,自然界的大部分現象和規律都可以用數學函式來描述,也就是可以求得乙個函式。神經網路 簡單又...