做深度學習目標檢測方面的同學一定會接觸到pascal voc資料集,前陣子準備按照它的格式準備自己的資料集。這裡就來詳細的記錄一下pascal voc的格式,包括目錄構成以及各個資料夾的內容格式。
各大演算法的leaderboards
常用搭配:
結構圖
└─voc2007
├─annotations
├─imagesets
│ ├─layout
│ ├─main
│ └─segmentation
├─jpegimages
├─segmentationclass
└─segmentationobject
必需的資料夾只有三個
└─voc2007
├─annotations
├─imagesets
│ ├─main
├─jpegimages
(可選): 在做分割問題的時候 還會用到另外幾個資料夾
>
>
voc2007folder
>
# 資料夾
# 檔名
>
tianchi datasource
>
# 檔案**,可隨意填寫
>
# 的長寬和通道數
>
512width
>
>
512height
>
>
3depth
>
size
>
>
0segmented
>
# 是否用於分割,0表示否,1表示是
>
# 每個目標用乙個object來描述
>
nodulename
>
# 類別名
>
unspecifiedpose
>
# 拍攝角度
>
0truncated
>
# 是否被截斷 0表示完整
>
1difficult
>
# 是否難以識別 0表示容易識別
>
# 左上角點和右下角點的畫素座標
>
217xmin
>
>
318ymin
>
>
225xmax
>
>
327ymax
>
bndbox
>
object
>
>
# 多個目標時重複新增object模組即可
>
nodulename
>
>
unspecifiedpose
>
>
0truncated
>
>
1difficult
>
>
>
168xmin
>
>
242ymin
>
>
174xmax
>
>
247ymax
>
bndbox
>
object
>
annotation
>
在製作xml的時候發現不一定需要使用xml等函式庫,直接使用自帶的open() 和file.write()來寫入,使用\t, \n來縮排和換行即可。
jpegimages資料夾中包含了pascal voc所提供的所有的資訊,包括了訓練和驗證。
這些影象都是以「年份_編號.jpg」格式命名的。
的畫素尺寸大小不一,但是橫向圖的尺寸大約在500*375左右,縱向圖的尺寸大約在375*500左右,
基本不會偏差超過100。(在之後的訓練中,第一步就是將這些都resize到300*300或是500*500,所有原始不能離這個標準過遠。)
這些影象就是用來進行訓練和測試驗證的影象資料。
jpegimages資料夾和annotations資料夾的對映關係是單射但非滿射
即 在annotations下有標註檔案,則在jpegimages資料夾下 必須要有與其對應的同名,反之,jpegimages可以有冗餘的,即使在annotations裡找不到它的標註檔案,在大部分的**裡都是可以正常執行的。
main資料夾是在imagesets資料夾下的乙個子資料夾,表示主任務的意思,其他資料夾在其他檢測或分割時才會用到,在普通的目標檢測中,屬於可有可無的檔案。
其中action下存放的是人的動作(例如running、jumping等等,這也是voc challenge的一部分)
layout下存放的是具有人體部位的資料(人的head、hand、feet等等,這也是voc challenge的一部分)
main下存放的是影象物體識別的資料,總共分為20類。
segmentation下存放的是可用於分割的資料。
這兩個資料夾下儲存了物體分割後的。只做檢測問題時可以忽略這兩個資料夾。
資料集 Pascal voc2007資料集分析
作為標準資料集,voc 2007 是衡量影象分類識別能力的基準。faster rcnn,yolo v1,yolo v2都以此資料集為最為演示樣例,因此,有必要了解一下本資料集的組成架構。voc資料集共包含 訓練集 5011幅 測試集 4952幅 共計9963幅圖,共包含20個種類。aeroplane...
PASCAL VOC資料集分析
pascal voc資料集分析 pascal voc為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。本文主要分析pascal voc資料集中和影象中物體識別相關的內容。其中在影象物體識別上著重需要了解的是annotations i...
Pascal VOC 資料集介紹
介紹pascal voc資料集 資料格式 衡量方式 voc2007,voc2012 有以下幾個task classification 略過 detection 將中所有的目標用bounding box bbox 框出來 segmentation 將中所有的目標分割出來 person layout 略...