深度學習流行網路與資料集

2021-07-30 07:41:00 字數 1626 閱讀 2276

一. 常用網路

深度學習相關的幾個比較著名的網路,alexnet、vgg、googlenet、resnet。

模型alexnet    

vgg       

googlenet  

resnet     

時間2012

2014

2014

2015層數8

1922

152top-5錯誤率

15.3%

7.3%

6.66%

3.57%

卷積層數516

21151

模型引數

60m500m

7m25m

從整體趨勢來看,準確度越來越高,同時網路層數也越來越多,可以認為網路結構的複雜性帶來效果的提高,而模型引數的數量並非越多越好,合適就好,引數數量太多可能會一定程度上導致過擬合問題。

二. 常用資料集

常用的資料訓練集如下:

資料集mnist       

imagenet

coco

pascal voc2012  

cifar-10  

cifar-100 內容

手寫體分類

目標檢測、分割和影象語義  

目標檢測、影象分類

影象分類

大小12mb

總1400多萬張

已標註100萬張約1tb  

30多萬張

40gb

2gb50,000個訓練影象  

170mb

類別劃分

10全類別

80種目標

2010

大家可以根據自己的需要設計網路,也可以考慮在現有成熟網路的基礎上做一些修改,當然也需要標註大量的資料,靠譜的做法是開發個自動標註工具,收集訓練樣本!

mnist:

imagenet:

coco:

voc:

cifar:

三. 其他資料集

其他資料集可以參考作者之前的總結:

機器學習實踐 - 車輛檢測

深度學習資料集

海量資料 又稱大資料 已經成為各大網際網路企業面臨的最大問題,如何處理海量資料,提供更好的解決方案,是目前相當熱門的乙個話題。類似mapreduce hadoop等架構的普遍推廣,大家都在構建自己的大資料處理,大資料分析平台。相應之下,目前對於海量資料處理人才的需求也在不斷增多,此類人才可謂炙手可熱...

深度學習資料集

牛津大學寵物資料集760mb pascal voc資料集 2012 是眾所周知的常用於物體檢測和分割的。超過11k的影象組成了訓練和驗證資料集,而10k影象專用於測試資料集。使用mean intersection over union miou 度量來評估分段挑戰。intersection over...

機器學習與深度學習常用資料集

包括影象分類領域 自然語言處理領域 目標檢測定位和coco資料集。經典的小型 28x28 畫素 灰度手寫數字資料集,開發於 20 世紀 90 年代,主要用於測試當時最複雜的模型 到了今日,mnist 資料集更多被視作深度學習的基礎教材。fast.ai 版本的資料集捨棄了原始的特殊二進位制格式,轉而採...