記錄 PASCAL VOC資料集分析

做深度學習目標檢測方面的同學一定會接觸到pascal voc資料集，前陣子準備按照它的格式準備自己的資料集。這裡就來詳細的記錄一下pascal voc的格式，包括目錄構成以及各個資料夾的內容格式。

各大演算法的leaderboards

常用搭配：

結構圖

└─voc2007 ├─annotations ├─imagesets │ ├─layout │ ├─main │ └─segmentation ├─jpegimages ├─segmentationclass └─segmentationobject

必需的資料夾只有三個

└─voc2007 ├─annotations ├─imagesets │ ├─main ├─jpegimages

（可選）：在做分割問題的時候還會用到另外幾個資料夾

>
>
voc2007folder
>
# 資料夾
# 檔名
>
tianchi datasource
>
# 檔案**，可隨意填寫
>
# 的長寬和通道數
>
512width
>
>
512height
>
>
3depth
>
size
>
>
0segmented
>
# 是否用於分割，0表示否，1表示是
>
# 每個目標用乙個object來描述
>
nodulename
>
# 類別名
>
unspecifiedpose
>
# 拍攝角度
>
0truncated
>
# 是否被截斷 0表示完整
>
1difficult
>
# 是否難以識別 0表示容易識別
>
# 左上角點和右下角點的畫素座標
>
217xmin
>
>
318ymin
>
>
225xmax
>
>
327ymax
>
bndbox
>
object
>
>
# 多個目標時重複新增object模組即可
>
nodulename
>
>
unspecifiedpose
>
>
0truncated
>
>
1difficult
>
>
>
168xmin
>
>
242ymin
>
>
174xmax
>
>
247ymax
>
bndbox
>
object
>
annotation
>

在製作xml的時候發現不一定需要使用xml等函式庫，直接使用自帶的open() 和file.write()來寫入，使用\t, \n來縮排和換行即可。

jpegimages資料夾中包含了pascal voc所提供的所有的資訊，包括了訓練和驗證。

這些影象都是以「年份_編號.jpg」格式命名的。

的畫素尺寸大小不一，但是橫向圖的尺寸大約在500*375左右，縱向圖的尺寸大約在375*500左右，

基本不會偏差超過100。（在之後的訓練中，第一步就是將這些都resize到300*300或是500*500，所有原始不能離這個標準過遠。）

這些影象就是用來進行訓練和測試驗證的影象資料。

jpegimages資料夾和annotations資料夾的對映關係是單射但非滿射

即在annotations下有標註檔案，則在jpegimages資料夾下必須要有與其對應的同名，反之，jpegimages可以有冗餘的，即使在annotations裡找不到它的標註檔案，在大部分的**裡都是可以正常執行的。

main資料夾是在imagesets資料夾下的乙個子資料夾，表示主任務的意思，其他資料夾在其他檢測或分割時才會用到，在普通的目標檢測中，屬於可有可無的檔案。

其中action下存放的是人的動作（例如running、jumping等等，這也是voc challenge的一部分）

layout下存放的是具有人體部位的資料（人的head、hand、feet等等，這也是voc challenge的一部分）

main下存放的是影象物體識別的資料，總共分為20類。

segmentation下存放的是可用於分割的資料。

這兩個資料夾下儲存了物體分割後的。只做檢測問題時可以忽略這兩個資料夾。

資料集 Pascal voc2007資料集分析

作為標準資料集，voc 2007 是衡量影象分類識別能力的基準。faster rcnn，yolo v1,yolo v2都以此資料集為最為演示樣例，因此，有必要了解一下本資料集的組成架構。voc資料集共包含訓練集 5011幅測試集 4952幅共計9963幅圖，共包含20個種類。aeroplane...

PASCAL VOC資料集分析

pascal voc資料集分析 pascal voc為影象識別和分類提供了一整套標準化的優秀的資料集，從2005年到2012年每年都會舉行一場影象識別challenge。本文主要分析pascal voc資料集中和影象中物體識別相關的內容。其中在影象物體識別上著重需要了解的是annotations i...

Pascal VOC 資料集介紹

介紹pascal voc資料集資料格式衡量方式 voc2007,voc2012 有以下幾個task classification 略過 detection 將中所有的目標用bounding box bbox 框出來 segmentation 將中所有的目標分割出來 person layout 略...

記錄 PASCAL VOC資料集分析

資料集 Pascal voc2007資料集分析

PASCAL VOC資料集分析

Pascal VOC 資料集介紹

相關推薦