資料集:pascal voc,imagenet,ms coco等資料集。
注:由於類別僅20個,因此被看成目標檢測方向的乙個基準資料集
imagenet資料集:是乙個計算機視覺系統識別專案,是目前世界上影象識別最大的資料庫,是美國斯坦福的計算機科學家,模擬人類的識別系統建立的。imagenet資料集是按照wordnet架構組織的大規模帶標籤影象資料集。大約1500萬張,2.2萬類,每張都經過嚴格的人工篩選與標記。imagenet類似於所有引擎。
其中,包括邊界框的目標檢測資料集,訓練資料集包括500,000張,屬於200類物體。由於資料集太大,訓練所需計算量很大;類別數較多;造成了很少使用和目標檢測的難度也很大。
ms coco資料集:是微軟公司建立的資料集。對於目標檢測任務,coco包含80個類別,每年大賽的訓練和和驗證集包含120,000張,超過40,000張測試。
深度學習目標檢測
流程狂徒如下 1 使用selective search提取proposes,然後利用cnn等識別技術進行分類。2 使用識別庫進行預訓練,而後用檢測庫調優引數。3 使用svm代替了cnn網路中最後的softmax,同時用cnn輸出的4096維向量進行bounding box回歸。4 流程前兩個步驟 候...
深度學習(六) 目標檢測
多個目標 思路 區域性識別問題 優點生成候選位置 擴充套件 過程 優點 缺點 候選位置提醋和方法 候選框進行svm分類 fine tune分類模型 特徵提取 單獨目標探測器訓練 資料集 評估方法 iou 優點 缺點 特徵一致化max pooling 位置 類別 聯合學習 速度快了精度提公升不多 怎麼...
深度學習 經典 資料集 彙總
mnist cifar open image voccoco imagenet youtube 8m size 12mb 170mb 1.5gb 2gb 40gb 大小400 600 1tb 1百萬張 主要有 cifar 10 和 cifar 100 官網 www.cs.toronto.edu kr...