深度學習很多框架都在使用voc資料集,所以先來研究一下voc資料集的具體內容。
以pascal voc2017為例,它包含如下5個資料夾:
pascal voc提供的所有的,其中包括訓練,測試。
存放xml格式的標籤檔案,每個xml對應jpegimage中的一張。可使用labelimg進行標註和檢視。
影象標註工具labelimg安裝教程及使用方法
//檔名
>
//影象**(不重要)
>
the voc2007 databasedatabase
>
>
pascal voc2007annotation
>
>
flickrimage
>
source
>
>
//影象尺寸(長寬以及通道數)
>
500width
>
>
332height
>
>
3depth
>
size
>
>
1segmented
>
//是否用於分割(在影象物體識別中01無所謂)
>
//檢測到的物體
>
horsename
>
//物體類別
>
rightpose
>
//拍攝角度
>
0truncated
>
//是否被截斷(0表示完整)
>
0difficult
>
//目標是否難以識別(0表示容易識別)
>
//bounding-box(包含左下角和右上角xy座標)
>
100xmin
>
>
96ymin
>
>
355xmax
>
>
324ymax
>
bndbox
>
object
>
>
//檢測到多個物體
>
personname
>
>
unspecifiedpose
>
>
0truncated
>
>
0difficult
>
>
>
198xmin
>
>
58ymin
>
>
286xmax
>
>
197ymax
>
bndbox
>
object
>
annotation
>
segmentation:用於分割的資料
驗證集(val)與測試集(test)是有區別的。
驗證集:val是validation的簡稱,驗證是否過擬合、以及用來調節訓練引數等。
測試集:當模型訓練完成後,用於檢測模型的準確性。
儲存的是物體分割後的資料,在物體識別中沒有用到。
VOC格式資料集轉YOLO格式資料集
voc使用xml來描述標註,而yolo使用txt格式檔案,導致voc格式資料集無法直接拿來訓練yolo,這就需要轉換格式。為了不重複造輪子,我們使用convert2yolo來進行轉換。python3 example.py datasets voc img path downloads voc2028...
coco分割資料集轉voc格式
coco資料中的ploygon即為標註資料,兩個相連數字為乙個座標 而voc的分割標註直接為png的8位偽彩色圖,通過呼叫調色盤來顯示色彩。因此,要把分割資料整理為voc格式,通過以下步驟 第一,在原圖中繪製目標輪廓並填充,需要注意的是,一般我們的資料都是32位rgb彩色圖,因此,首先需要將32位r...
製作VOC資料集
使用opencv,外接攝像頭,按一定幀率採集影象,如下 import cv2 as cv cap cv.videocapture 0 fourcc cv.videowriter fourcc x v i d out cv.videowriter r c users chen desktop pyto...