資料集:http://計算機視覺
mnist: 最通用的健全檢查。25x25 的資料集,中心化,b&w 手寫數字。這是個容易的任務——但是在 mnist 有效,不等同於其本身是有效的。
cifar 10 & cifar 100: 32x32 彩色影象。雖不再常用,但還是用了一次,可以是一項有趣的健全檢查。
imagenet: 新演算法實際上的影象資料集。很多 api 公司從其 rest 介面獲取標籤,這些標籤被懷疑與 imagenet 的下一級 wordnet 的 1000 個範疇很接近。
lsun: 場景理解具有很多輔助任務(房間布置評估、顯著性**等)和乙個相關競爭。
pascal voc: 通用影象分割/分類:對於構建真實世界的影象注釋毫無用處,對於基線則意義重大。
svhn: 來自谷歌街景檢視(google street view)的房屋數量。把這想象成荒野之中的週期性 mnist。
ms coco: 帶有乙個相關性競爭的通用影象理解/字幕。
visual genome: 非常詳細的視覺知識庫,並帶有 100k 影象的深字幕。
labeled faces in the wild:通過名稱識別符號,已經為被裁剪的面部區域(用 viola-jones)打了標籤。現有人類的子集在資料集中有兩個影象。對於這裡做面部匹配系統訓練的人來說,這很正常。
imagenet的ilsvrc2012資料集
Caffe 框架介紹
1.caffe是一種開源軟體框架,內部提供了一套基本的程式設計框架,或者說乙個模板框架,用以實現gpu並行架構下的深度卷積神經網路,deep learning等演算法,我們可以按照框架定義各種各樣的卷積神經網路的結構,並且可以再此框架下增加自己的 設計新的演算法,該框架的乙個問題就是,只能夠使用卷積...
caffe 引數介紹
目錄 net models bvlc alexnet train val.prototxt test iter 1000 test interval 1000 base lr 0.01 開始的學習率 lr policy step 學習率的drop是以gamma在每一次迭代中 gamma 0.1 st...
Pascal VOC 資料集介紹
介紹pascal voc資料集 資料格式 衡量方式 voc2007,voc2012 有以下幾個task classification 略過 detection 將中所有的目標用bounding box bbox 框出來 segmentation 將中所有的目標分割出來 person layout 略...