一. 常用網路
深度學習相關的幾個比較著名的網路,alexnet、vgg、googlenet、resnet。
模型alexnet
vgg
googlenet
resnet
時間2012
2014
2014
2015層數8
1922
152top-5錯誤率
15.3%
7.3%
6.66%
3.57%
卷積層數516
21151
模型引數
60m500m
7m25m
從整體趨勢來看,準確度越來越高,同時網路層數也越來越多,可以認為網路結構的複雜性帶來效果的提高,而模型引數的數量並非越多越好,合適就好,引數數量太多可能會一定程度上導致過擬合問題。
二. 常用資料集
常用的資料訓練集如下:
資料集mnist
imagenet
coco
pascal voc2012
cifar-10
cifar-100 內容
手寫體分類
目標檢測、分割和影象語義
目標檢測、影象分類
影象分類
大小12mb
總1400多萬張
已標註100萬張約1tb
30多萬張
40gb
2gb50,000個訓練影象
170mb
類別劃分
10全類別
80種目標
2010
大家可以根據自己的需要設計網路,也可以考慮在現有成熟網路的基礎上做一些修改,當然也需要標註大量的資料,靠譜的做法是開發個自動標註工具,收集訓練樣本!
mnist:
imagenet:
coco:
voc:
cifar:
三. 其他資料集
其他資料集可以參考作者之前的總結:
機器學習實踐 - 車輛檢測
深度學習資料集
海量資料 又稱大資料 已經成為各大網際網路企業面臨的最大問題,如何處理海量資料,提供更好的解決方案,是目前相當熱門的乙個話題。類似mapreduce hadoop等架構的普遍推廣,大家都在構建自己的大資料處理,大資料分析平台。相應之下,目前對於海量資料處理人才的需求也在不斷增多,此類人才可謂炙手可熱...
深度學習資料集
牛津大學寵物資料集760mb pascal voc資料集 2012 是眾所周知的常用於物體檢測和分割的。超過11k的影象組成了訓練和驗證資料集,而10k影象專用於測試資料集。使用mean intersection over union miou 度量來評估分段挑戰。intersection over...
機器學習與深度學習常用資料集
包括影象分類領域 自然語言處理領域 目標檢測定位和coco資料集。經典的小型 28x28 畫素 灰度手寫數字資料集,開發於 20 世紀 90 年代,主要用於測試當時最複雜的模型 到了今日,mnist 資料集更多被視作深度學習的基礎教材。fast.ai 版本的資料集捨棄了原始的特殊二進位制格式,轉而採...