卷積神經網路(cnn)是一種特殊的對影象識別的方式,屬於帶有前向反饋的網路,可用來合理有效的減少神經網路的引數個數。其特點是經過多次特徵提取,關聯型、序列型或結構化等型別的特徵被提取,主要來識別二維圖形。
(1)輸入層:代表一張圖的畫素矩陣;如32×32×3。
特徵提取:
(2)卷積層:深入分析得到抽象程度更高的特徵;經過卷積層的節點矩陣深度會增加。
(3)池化層:不改變三維結構,縮小矩陣的大小;高解析度到低解析度,縮小全連線層節點數,從而減少引數。
分類任務:
(4)全連線層:一般1到2層分類資訊。
(5)softmax層:用於分類問題,得到不同種類的概率分布情況。
(1)三維結構的網路容量(包含:長、寬、高)。
包含三維空間中神經元的卷積神經網路,作為視覺化的乙個層。卷積網路的每一層都將三維輸入轉換為三維輸出值。
分別代表畫素和色彩通道
(2)組成部分
note:①過濾器尺寸只需制定兩個維度,另乙個要人工設定的是深度。
②對影象應用乙個過濾器,將產生乙個對應的特徵圖譜(fm)。
引數計算: ①當使用全0填充 out = [in / stride]
②不使用全0填充 out = [(in - filter +1 ) / stride ]
引數 (尺寸×輸入深度+1)× 深度
note:最後乙個池化層通常連線到乙個或多個全連線層,全連線層的輸出就是最終的輸出。
(2)基本流程
1°輸入影象,通過和若干過濾器和可加偏置進行卷積,產生相應個fm;
2°fm每組的四個畫素進行求和、加權值和加偏置,通過sigmod函式得到相應特徵對映圖;
3°繼續卷積直到最後乙個子取樣層;
4°將這些畫素處理規則化,並連線成乙個向量輸入到傳統的神經網路,得到輸出。
通過感受區域和權值共享減少了神經網路需要的引數的個數。
(1)子取樣層分組特徵提取
原始資料分組特徵提取,可以減少連線數目,即減少神經網路需要訓練的權值引數的個數。
引數計算:若1000×1000的影象,隱層神經元個數1000×1000,權值引數個數為10^12。
區域性感受域10×10,權值引數個數1000×1000×10×10=10^8。
(2)權值共享
應用小尺寸卷積核對應的引數共享在大尺寸影象上進行卷積,從而在大尺寸影象任意位置獲得乙個此特徵的啟用值。
引數計算:若10×10卷積核則100個權值引數,提取一種特徵;共100個卷積核
權值引數個數:100種卷積核×每種卷積核共享100個引數=10000
note:此方法隱層引數個數和隱層神經元個數無關,只和卷積核的大小、種類有關。
深度學習 卷積神經網路
一 卷積神經網路基礎 二 lenet 三 常見的一些卷積神經網路 卷積層的超引數 填充和步幅。步幅 stride 每次卷積核在輸入陣列上滑動的行數與列數。多輸入與輸出通道 將3維陣列除寬高外的一維稱為通道維。1 1卷積層 包含1 1的卷積核的卷積層。1 1卷積核在不改變輸入高寬的情況下調整通道數。如...
深度學習 卷積神經網路
卷積神經網路 convolutional neural networks,cnn 是一類包含卷積計算且具有深度結構的前饋神經網路 feedforward neural networks 是深度學習 deep learning 的代表演算法之一。卷積神經網路具有表徵學習 representation ...
深度學習之卷積神經網路
卷積神經網路是一種多層神經網路,擅長處理影象特別是大影象的相關機器學習問題。卷積網路通過一系列方法,成功將資料量龐大的影象識別問題不斷降維,最終使其能夠被訓練。cnn最早由yann lecun提出並應用在手寫字型識別上 minst lecun提出的網路稱為lenet,其網路結構如下 這是乙個最典型的...