關於VOC與COCO資料集檔案裡的內容

2021-10-20 12:07:59 字數 2008 閱讀 8724

本文的內容基於pascal voc2012和coco2014,若有不當之處,還請各位教正。

pascal voc提供的所有的,其中包括訓練,測試,總共1712張。

# 檔名

# 影象尺寸(長寬以及通道數)

1920

<

/width>

1080

<

/height>

3<

/depth>

<

/size>

0<

/segmented>

# 是否用於分割(在影象物體識別中01無所謂)

<

object

>

# 檢測到的物體

car<

/name>

# 物體類別

unspecified<

/pose>

# 拍攝角度(目標的姿勢)

0<

/truncated>

# 目標是否被截斷(0表示不是)

0<

/difficult>

# 目標是否難以識別(0表示容易識別)

# bounding box左下、右下角xy座標

735<

/xmin>

230<

/ymin>

1917

<

/xmax>

806<

/ymax>

<

/bndbox>

<

/object

>

<

/annotation>

segmentation:用於分割的資料

main 和 segmentation的作用相當於名單,當模型要用的時候,根據名單找到對應的 img。

兩者img數都是2913.

另外,語義分割與例項分割的區別在於:

因此開啟segmentationobject 和 segmentationclass 可發現兩者異同

"area": 54652.9556, # 語義分割或bbox的區域大小

"iscrowd": 0, # 是否是人群

"image_id": 480023, # 對應的img的id

"bbox": [116.95, 305.86, 285.3, 266.03], # 目標框

"category_id": 58, # 類別的標識

"id": 86 # 每個目標的id,是annotation的唯一標識

},......]

"categories":[  # 類別描述

,......]

在使用的時候,我們只需取出 images,annotations 和 categories 即可。

參考文獻:

[1]

[2]

[3]

[4]

coco分割資料集轉voc格式

coco資料中的ploygon即為標註資料,兩個相連數字為乙個座標 而voc的分割標註直接為png的8位偽彩色圖,通過呼叫調色盤來顯示色彩。因此,要把分割資料整理為voc格式,通過以下步驟 第一,在原圖中繪製目標輪廓並填充,需要注意的是,一般我們的資料都是32位rgb彩色圖,因此,首先需要將32位r...

VOC格式資料轉COCO格式

博主使用labelme對目標檢測資料進行標註的時候,標註的結果只能選擇是voc格式的檔案。但是,現在新的網路一般都是用coco格式的資料進行執行的。所以,乙個voc轉coco格式的 就變得非常重要了。這篇部落格主要是為了資料增廣的那篇做引用的,所以原理就不說了,直接上 吧。在實際執行執行的時候,資料...

製作VOC資料集

使用opencv,外接攝像頭,按一定幀率採集影象,如下 import cv2 as cv cap cv.videocapture 0 fourcc cv.videowriter fourcc x v i d out cv.videowriter r c users chen desktop pyto...