影象的卷積概述
一般,通過對進行卷積操作,可以對進行某種效果的增強或者是減弱,比如模糊、銳化、浮雕效果等,當然也可以發現中的某些特徵,如查詢物體的邊緣資訊。
什麼是卷積核
一張卷積後的效果,絕大部分取決於它的卷積核。卷積核就是乙個2維的陣列,行列數相等而且為奇數(因為每個卷積核都是對於它中心的那個畫素的作用,只有奇數才能有最中心的那個畫素)。它裡面的元素值代表不同的權值。一般而言,卷積核裡面的所有元素之和為1,當然也可以不等於1.大於1時生成的亮度會增加,小於1時生成的亮度會降低。
那麼,卷積核是怎麼作用在一張圖上的呢?
針對輸入中的單個畫素,將它的值由周圍臨近畫素值加權平均。而這種加權平均的操作產生的新畫素值按照次序可以產生一張新的輸出。
卷積後的尺寸
如果輸入尺寸是m x n, 輸出尺寸是 l x c, 步長用stride表示, 卷積核大小為 k, 那麼
一般而言,輸出尺寸都比輸入尺寸要小,為了得到跟輸入尺寸大小相同的,我們可以用padding。
caffe 中的卷積操作原理
滑動視窗在影象中每滑動乙個地方,將影象中該滑動視窗影象展開為一列 (也就是flatten),所有列組成圖中的滑動視窗矩陣,這裡假設pad=1,stride=1,k=3,則滑動視窗矩陣每行大小為w*h,一共k*k行.
每個核展開為一行,n個核形成的核矩陣大小為n*k*k。
最後將核矩陣和滑動視窗矩陣相乘,每一行就是乙個特徵圖,n個卷積核形成n個特徵圖。
擴充套件到三維
三維和二維性質相同,不過是多了乙個通道的概念。
參考:
深度學習之卷積神經網路
卷積神經網路是一種多層神經網路,擅長處理影象特別是大影象的相關機器學習問題。卷積網路通過一系列方法,成功將資料量龐大的影象識別問題不斷降維,最終使其能夠被訓練。cnn最早由yann lecun提出並應用在手寫字型識別上 minst lecun提出的網路稱為lenet,其網路結構如下 這是乙個最典型的...
深度學習之卷積神經網路
目錄 持續更新 概述 卷積神經網路中啟用函式relu 卷積網路 卷積網路架構 卷積層輸出計算 池化層的輸出計算 卷積神經網路的訓練 卷積層的訓練 pooling層的訓練 卷積神經網路 cnn 一種更適合影象 語音識別任務的神經網路結構 用cnn解決的問題都存在區域性與整體的關係。由低層次的特徵經過組...
深度學習 卷積理解
一.深度卷積神經網路學習筆記 一 假設輸入影象尺寸為w,卷積核尺寸為f,步幅 stride 為s 卷積核移動的步幅 padding使用p 用於填充輸入影象的邊界,一般填充0 那麼經過該卷積層後輸出的影象尺寸為 w f 2p s 1。2.它寫出為什麼會用padding?卷積核大小該如何確定?strid...