利用json庫讀取json檔案,得到如下結果
with open('./dataset/mchar_val.json','r',encoding='utf8')as fp:
json_data = json.load(fp) print('這是檔案中的json資料:',json_data)
3.利用opencv庫函式實現資料的視覺化。
全部**如下:
import json
import cv2
img_path="./dataset/mchar_val/"
with open('./dataset/mchar_val.json','r',encoding='utf8')as fp:
json_data = json.load(fp)
print('這是檔案中的json資料:',json_data)
cnt=0
#得到前5條資料並利用matplot視覺化資料集
for tmp in json_data:
if cnt >5:
break;
temp_path=img_path+tmp
img = cv2.imread(temp_path)
cv2.namedwindow('test', cv2.window_normal)
cv2.resizewindow('test', 1000, 1000)
print(json_data[tmp]['label'])
label_len=len(json_data[tmp]['label'])
print("***:",json_data[tmp]['top'][0])
for i in range(0,label_len):
y=int(json_data[tmp]['top'][i])
x=int(json_data[tmp]['left'][i])
w=int(json_data[tmp]['width'][i])
h=int(json_data[tmp]['height'][i])
cv2.rectangle(img, (x,y),(x+w,y+h), (0, 0, 255), 1)
cv2.puttext(img, str(json_data[tmp]['label'][i]), (x-3,y-3), cv2.font_hershey_complex_small, 0.3, (255, 0, 0))
cv2.imshow("test",img)
key = cv2.waitkey(0)
# if key == ord('m'):
# continue
cnt+=1
# train_label = [json_data[x]['label'] for x in json_data]
# print(train_label)
# print('這是讀取到檔案資料的資料型別:', type(json_data))
街景字元編碼識別1
該資料來自真實場景的門牌號。訓練集資料報括 3w 張 驗證集資料報括 1w 張 每張 包括顏色影象和對應的編碼類別和具體位置 為了保證比賽的公平性,測試集a包括 4w 張 測試集b包括 4w 張 相關資料 所有的資料使用 訓練集和驗證集 json格式進行標註,如果乙個檔案中包含多個字元,則使用列表將...
天池 Datawhale 街景字元編碼識別
天池 datawhale 街景字元編碼識別 task1 賽題理解 需要選手 真實場景下的字元識別,這是乙個典型的字元識別問題 分類問題 資料集 自google街景影象中的門牌號資料集 the street view house numbers dataset,svhn 並根據一定方式取樣得到比賽資料...
街景字元識別 模型整合
3.後處理 整合學習方法可以提高 精度,常見的有stacking bagging和boosting。一般利用交叉驗證法提高精度,如下所示。使用10折交叉驗證法,得到10個cnn模型,可通過以下方法進行整合。平均 結果的概率值,然後解碼為具體字元。對 的字元進行投票,得到最終字元。dropout在訓練...