記錄 PASCAL VOC資料集分析

2021-09-02 10:57:21 字數 2903 閱讀 2317

做深度學習目標檢測方面的同學一定會接觸到pascal voc資料集,前陣子準備按照它的格式準備自己的資料集。這裡就來詳細的記錄一下pascal voc的格式,包括目錄構成以及各個資料夾的內容格式。

各大演算法的leaderboards

常用搭配:

結構圖

└─voc2007

├─annotations

├─imagesets

│ ├─layout

│ ├─main

│ └─segmentation

├─jpegimages

├─segmentationclass

└─segmentationobject

必需的資料夾只有三個

└─voc2007

├─annotations

├─imagesets

│ ├─main

├─jpegimages

(可選): 在做分割問題的時候 還會用到另外幾個資料夾

>

>

voc2007folder

>

# 資料夾

# 檔名

>

tianchi datasource

>

# 檔案**,可隨意填寫

>

# 的長寬和通道數

>

512width

>

>

512height

>

>

3depth

>

size

>

>

0segmented

>

# 是否用於分割,0表示否,1表示是

>

# 每個目標用乙個object來描述

>

nodulename

>

# 類別名

>

unspecifiedpose

>

# 拍攝角度

>

0truncated

>

# 是否被截斷 0表示完整

>

1difficult

>

# 是否難以識別 0表示容易識別

>

# 左上角點和右下角點的畫素座標

>

217xmin

>

>

318ymin

>

>

225xmax

>

>

327ymax

>

bndbox

>

object

>

>

# 多個目標時重複新增object模組即可

>

nodulename

>

>

unspecifiedpose

>

>

0truncated

>

>

1difficult

>

>

>

168xmin

>

>

242ymin

>

>

174xmax

>

>

247ymax

>

bndbox

>

object

>

annotation

>

在製作xml的時候發現不一定需要使用xml等函式庫,直接使用自帶的open() 和file.write()來寫入,使用\t, \n來縮排和換行即可。

jpegimages資料夾中包含了pascal voc所提供的所有的資訊,包括了訓練和驗證。

這些影象都是以「年份_編號.jpg」格式命名的。

的畫素尺寸大小不一,但是橫向圖的尺寸大約在500*375左右,縱向圖的尺寸大約在375*500左右,

基本不會偏差超過100。(在之後的訓練中,第一步就是將這些都resize到300*300或是500*500,所有原始不能離這個標準過遠。)

這些影象就是用來進行訓練和測試驗證的影象資料。

jpegimages資料夾和annotations資料夾的對映關係是單射但非滿射

即 在annotations下有標註檔案,則在jpegimages資料夾下 必須要有與其對應的同名,反之,jpegimages可以有冗餘的,即使在annotations裡找不到它的標註檔案,在大部分的**裡都是可以正常執行的。

main資料夾是在imagesets資料夾下的乙個子資料夾,表示主任務的意思,其他資料夾在其他檢測或分割時才會用到,在普通的目標檢測中,屬於可有可無的檔案。

其中action下存放的是人的動作(例如running、jumping等等,這也是voc challenge的一部分)

layout下存放的是具有人體部位的資料(人的head、hand、feet等等,這也是voc challenge的一部分)

main下存放的是影象物體識別的資料,總共分為20類。

segmentation下存放的是可用於分割的資料。

這兩個資料夾下儲存了物體分割後的。只做檢測問題時可以忽略這兩個資料夾。

資料集 Pascal voc2007資料集分析

作為標準資料集,voc 2007 是衡量影象分類識別能力的基準。faster rcnn,yolo v1,yolo v2都以此資料集為最為演示樣例,因此,有必要了解一下本資料集的組成架構。voc資料集共包含 訓練集 5011幅 測試集 4952幅 共計9963幅圖,共包含20個種類。aeroplane...

PASCAL VOC資料集分析

pascal voc資料集分析 pascal voc為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。本文主要分析pascal voc資料集中和影象中物體識別相關的內容。其中在影象物體識別上著重需要了解的是annotations i...

Pascal VOC 資料集介紹

介紹pascal voc資料集 資料格式 衡量方式 voc2007,voc2012 有以下幾個task classification 略過 detection 將中所有的目標用bounding box bbox 框出來 segmentation 將中所有的目標分割出來 person layout 略...