在yolov3目標識別任務中,有乙個必不可少的步驟,就是標籤的格式轉換,例如用imagelabel標註了目標框,但是得到的標籤格式為xml,如果想將他轉換為txt格式如何處理?
轉換成
000001.jpg 366,29,441,164 red
上述是乙個例子, 假設資料夾a下有若干個xml檔案,
需要轉換成若干行如下的txt檔案,例如,
可參考我寫的**。
import os
import xml.etree.elementtree as et
path=r"g:\lacoo_dataset\detector\train_ann"
class_list=["red","yellow","green","right","stop"]
def xml_text_sigle(path,str_):
tree = et.parse(path)
root=tree.getroot()
for child in root:
if child.tag=="filename":
str_+=child.text
str_+=" "
if child.tag=="object":
for chileren in child:
if chileren.tag=="bndbox":
for i in range(4):
str_+=chileren[i].text
if i<3:
str_+=","
if chileren.tag=="name":
str_+=str(class_list.index(chileren.text))
str_+=" "
str_list = str_.split(" ")
str_list.remove(str_list[1])
str_ = " ".join(str_list)
return str_
def xml_test(path):
t = open("t.txt", "w")
for i in os.listdir(path):
t.writelines(xml_text_sigle(os.path.join(path,i),"")+"\n")
xml_test(path)
這裡將標籤用數字代替,得到的txt格式為
目標檢測之常用資料集
我們在利用模型檢測實際應用問題的時候,通常需要使用自己標註和收集資料集來進行訓練。但對於不同演算法效能的比較,我們常常需要一些基本的資料集來進行橫向對比。下列是一些常用的目標檢測資料集 pascal voc挑戰在2005年至2012年間展開。pascal voc 2007 9963張影象,24640...
目標檢測經典資料集 深度學習
資料集 pascal voc,imagenet,ms coco等資料集。注 由於類別僅20個,因此被看成目標檢測方向的乙個基準資料集 imagenet資料集 是乙個計算機視覺系統識別專案,是目前世界上影象識別最大的資料庫,是美國斯坦福的計算機科學家,模擬人類的識別系統建立的。imagenet資料集是...
PascalVOC2012目標檢測資料集中的問題
pascalvoc2012的目標檢測資料集一共有20類,每一類目標的具體情況如下 person 17401個 aeroplane 1002個 tvmonitor 893個 train 704個 boat 1059個 dog 1598個 chair 3056個 bird 1271個 bicycle 8...