pk的內容包括:目標檢測與例項分割、人體關鍵點檢測、材料識別、全景分割、影象描述目標檢測/例項分割資料標註檔案解析使用json檔案儲存其注釋檔案中的內容就是乙個字典資料結構,包括以下5個key-value對。其中info、images、licenses三個key是三種型別標註檔案共享的,最後的annotations和categories按照不同的任務有所不同,下面詳細介紹一下每個key欄位的含義。
(一)info欄位:包括下圖中的內容,很好理解,這裡就不贅述了。
(二)licenses欄位:包括下圖中的內容,裡面集合了不同型別的licenses,並在images中按照id號被引用,基本不參與到資料解析過程中。
(四)categories欄位:包括下圖中的內容。其中supercategory是父類,name是子類,id是類別id(按照子類統計)。比如下圖中所示的。coco資料集共計有80個類別(按照name計算的)
rle演算法概述
將影象中目標區域的畫素值設定為1,背景設定為0,則形成乙個張二值圖,該二值圖可以使用z字形按照位置進行
編碼,例如:0011110011100000……
但是這樣的形式太複雜了,可以採用統計有多少個0和1的形式進行區域性壓縮,因此上面的rle編碼形式為:
2-0-4-1-2-0-3-1-5-0……(表示有2個0,4個1,2個0,3個1,5個0)
COCO資料集製作
ms coco的全稱是microsoft common objects in context,源於微軟於2014年出資標註的microsoft coco資料集,其地位與imagenet等同,是衡量通用模型效能的最佳資料集之一。coco資料集是乙個大型的 豐富的物體檢測,分割和字幕資料集。以scene...
使用COCO資料集報錯
1.背景 跑深度學習的 時,用到coco資料集,就需要用到cocoapi,我們按照它的requirement來,直接把pythonapi放在相應的資料夾下,會報錯importerror no module named pycocotools.mask 或importerror no module n...
pytorch讀取coco資料集
yolov3 an incremental improvement 原理在該篇部落格就寫的很詳細了,這裡就不贅述了 bin bash credit clone coco api git clone cd coco mkdir images cd images download images wget...