SSD主幹網路(基於vgg16)

2021-10-01 10:51:18 字數 1487 閱讀 1776

在這裡我們來說一說,基於vgg16的ssd的整體網路結。

首先,先來說一遍vgg16。如圖,在圖中d列就是今天要說的vgg16結構。

如圖,下圖為vgg16的結構示意。

簡單的來說一下,

第乙個肯定是輸入(),224*224*3指的是的解析度是224*224,通道數是3。

到了block1處,卷積核為3*3*3,有64個這樣子的卷積核。3*3*3是因為對乙個通道有3*3大小的卷積核, 共有三個通道,故卷積核為3*3*3。完成卷積計算後,我們會得到乙個224*224*64的featuremap(卷積層),然後我們再將其卷積一次並保持大小不變,得到了另乙個224*224*64的featuremap(卷積層),在這裡的卷積核大小為3*3*64*64,3*3*64的意思是有64層卷積範圍為3*3的卷積操作,這樣卷積操作(卷積核)有64個。

進行池化操作,將乙個224*224*64調整為112*112*64,。

到了block2處,這裡的卷積核為3*3*64,有128個這樣子的卷積核,為什麼是3*3*64和block1相同,3*3是對每乙個通道的卷積大小,64是block1的通道數,128為block2的通道數,然後維持卷積層的規模不變,再次卷積一次,以此類推

簡單的說完了vgg16後,接下來就是ssd主幹網路了。

如圖,ssd網路結構如下 。 

ssd以vgg16為基礎,將輸出設為300*300和512*512兩種,這裡我們討論300*300為輸入的情況。

將vgg16的soft-max層、fc-1000和與fc-4096相連的maxpool層刪除。再新增4塊(注意不是層),對應圖中的extra feature layers所示。而每一層對應featuremap大小如下:

input        300*300*3

block1      300*300*64

block2      150*150*128

pool2        75*75*128

block3      75*75*256

pool3        38*38*256

block4      38*38*512

pool4        19*19*512

block5      19*19*512

block6      19*19*1024

block7       19*19*1024

block8       10*10*512

block9       5*5*256

block10      3*3*256

block11      1*1*256

VGG16網路模型

該網路提出了卷積神經網路的深度增加和小卷積核的使用對網路的最終分類識別效果有很大的作用。後兩個網路對卷積核的開刀的優化方法也證明了這一觀點。在 的實驗中,證明了在大規模影象識別任務中卷積神經網路的深度對準確率的影響。主要的貢獻是利用帶有很小卷積核 3 3 的網路結構對逐漸加深的網路進行評估,結果表明...

VGG16網路結構

vgg 訓練資料處理過程 let s be the smallest side of an isotropically rescaled training image.各向同性的縮放訓練影象的最小邊 以s 256為例 1.將進行等比例縮放,最小邊長度為256 2.對等比例比變化後的影象隨機擷取224...

經典卷積神經網路之 VGG16

命名 16表示除pooling layer外使用conv layer的層數 1.vggnet探索了卷積神經網路的深度與其效能之間的關係,通過反覆堆疊3 3的小型卷積核和2 2的最大池化層,vggnet成功地構築了16 19層深的卷積神經網路 2.vggnet結構簡潔,整個網路都使用了同樣大小的卷積核...