對於訓練資料每張將給出對應得編碼標籤,和具體的字元框的位置(訓練集、測試集和驗證集都給出字元位置)、可用於模型訓練
在比賽資料的訓練集、測試集和驗證集中,同一張可能包括乙個或者多個字元,因此在json標註中,會有兩個字元的邊框資訊。
資料指標:
top:左上角座標x
height:字元高度
left:左上角座標y
width:字元寬度
label:字元編碼
該賽題的本質是分類問題,對的字元進行識別,但賽題給定資料中不同中包含的字元數量不等。
因此根據以下兩種思路進行**:1.定長字元識別 2.不定長字元識別
其中第一種思路較為簡單,瀏覽賽題資料集中大部分影象中字元數為2-4個,最多的字元個數為6個。因此可以對於所有的影象都抽象為6個字元的識別問題。
score=編碼識別正確的數量/測試集數量
零基礎入門CV賽事 Task1 賽題理解
賽題名稱 零基礎入門cv之街道字元識別 賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。為了簡化賽題難度,賽題資料採用公開資料集svhn,因此大家...
零基礎入門CV賽事 Task1 賽題理解
賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。import json train json json.load open r d study c...
零基礎入門CV賽事 Task1 賽題理解
賽題名稱 零基礎入門cv之街道字元識別 賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。注意 按照比賽規則,只能使用比賽給定的資料集完成訓練,不能使用svhn原始資料集。訓練集包括3w張 驗證集包括1w張 每張 包括顏色影象和對應的編碼類別和具體位置 ...