最近研究了目標檢測的ssd演算法,在進行資料tfrecord格式製作之後,需要統計訓練集和測試集的各類數和框定數
參考:統計數目不可能乙個個數,我們需要將train.txt下的檔名所對應的xml檔案提取出來,再配合網友製作的統計**即可
統計**:
我這裡要做的就是中間步驟,匹配出對應的xml即可,利用python並不難
**如下:
# -*- coding:utf-8 -*-
# author: agent xu
import os
import glob
import shutil
from pil import image
#指定找到檔案後,另存為的資料夾路徑
outdir = os.path.abspath('c:/users/administrator/desktop/ead2019/ead2019_trainingdata-i/test_xml')
#指定txt文字的位置
txtdir1 = os.path.abspath('./voc2007/imagesets/main/test.txt')
imgname1=
with open(txtdir1,'r') as f:
for line in f:
#資料夾路徑
imagedir2 = os.path.abspath('./voc2007/annotations')
image2 =
imgname2 =
imagelist2 = glob.glob(os.path.join(imagedir2, '*.xml'))
for item in imagelist2:
for item in image2:
(temp1, temp2) = os.path.splitext(item)
#匹配for item1 in imgname1:
for item2 in imgname2:
if item1 == item2:
dir = image2[imgname2.index(item2)]
xmlname=os.path.join(imagedir2,dir)
print(xmlname)
shutil.copy(xmlname,outdir)
這樣就可以了,然後統計改**引數,訓練就好啦。 資料夾下txt重新命名
path result 對該路徑下所有檔案重新命名排序 count 1file list os.listdir path 該資料夾下所有的檔案 包括資料夾 file list.sort key lambda x int x 4 遮蔽字尾排序 forfile in file list 遍歷所有檔案 o...
python根據txt文字批量建立資料夾
前言 前言 想寫這個 lhjhiqgymw的原因是因為實習的時候需要根據 名建立對應的資料夾,如果只是很少個數資料夾的話,ctrl shift n還可以接受吧,可是一次就要建立幾百個資料夾,這就有點方方了。所以我寫了一些 解決實際的問題吧。正文正文 其實這是乙個簡單的 集合,然後就實現了 目錄結構 ...
linux下查詢檔案夾下匹配的內容grep指令
問題現象 遍歷當前目錄下的所有檔案,查詢文字所在的檔案 問題解決 grep指令 問題實現 grep r 其他用法 1.從檔案內容查詢匹配指定字串的行 grep 被查詢的字串 檔名 例子 在當前目錄裡第一級資料夾中尋找包含指定字串的.in檔案 grep thermcontact in 2.從檔案內容查...