本文的內容基於pascal voc2012和coco2014,若有不當之處,還請各位教正。
pascal voc提供的所有的,其中包括訓練,測試,總共1712張。
# 檔名
# 影象尺寸(長寬以及通道數)
1920
<
/width>
1080
<
/height>
3<
/depth>
<
/size>
0<
/segmented>
# 是否用於分割(在影象物體識別中01無所謂)
<
object
>
# 檢測到的物體
car<
/name>
# 物體類別
unspecified<
/pose>
# 拍攝角度(目標的姿勢)
0<
/truncated>
# 目標是否被截斷(0表示不是)
0<
/difficult>
# 目標是否難以識別(0表示容易識別)
# bounding box左下、右下角xy座標
735<
/xmin>
230<
/ymin>
1917
<
/xmax>
806<
/ymax>
<
/bndbox>
<
/object
>
<
/annotation>
segmentation:用於分割的資料
main 和 segmentation的作用相當於名單,當模型要用的時候,根據名單找到對應的 img。
兩者img數都是2913.
另外,語義分割與例項分割的區別在於:
因此開啟segmentationobject 和 segmentationclass 可發現兩者異同
"area": 54652.9556, # 語義分割或bbox的區域大小
"iscrowd": 0, # 是否是人群
"image_id": 480023, # 對應的img的id
"bbox": [116.95, 305.86, 285.3, 266.03], # 目標框
"category_id": 58, # 類別的標識
"id": 86 # 每個目標的id,是annotation的唯一標識
},......]
"categories":[ # 類別描述
,......]
在使用的時候,我們只需取出 images,annotations 和 categories 即可。
參考文獻:
[1]
[2]
[3]
[4]
coco分割資料集轉voc格式
coco資料中的ploygon即為標註資料,兩個相連數字為乙個座標 而voc的分割標註直接為png的8位偽彩色圖,通過呼叫調色盤來顯示色彩。因此,要把分割資料整理為voc格式,通過以下步驟 第一,在原圖中繪製目標輪廓並填充,需要注意的是,一般我們的資料都是32位rgb彩色圖,因此,首先需要將32位r...
VOC格式資料轉COCO格式
博主使用labelme對目標檢測資料進行標註的時候,標註的結果只能選擇是voc格式的檔案。但是,現在新的網路一般都是用coco格式的資料進行執行的。所以,乙個voc轉coco格式的 就變得非常重要了。這篇部落格主要是為了資料增廣的那篇做引用的,所以原理就不說了,直接上 吧。在實際執行執行的時候,資料...
製作VOC資料集
使用opencv,外接攝像頭,按一定幀率採集影象,如下 import cv2 as cv cap cv.videocapture 0 fourcc cv.videowriter fourcc x v i d out cv.videowriter r c users chen desktop pyto...