入門CV賽題理解

2021-10-06 08:21:22 字數 434 閱讀 4954

對於訓練資料每張將給出對應得編碼標籤,和具體的字元框的位置(訓練集、測試集和驗證集都給出字元位置)、可用於模型訓練

在比賽資料的訓練集、測試集和驗證集中,同一張可能包括乙個或者多個字元,因此在json標註中,會有兩個字元的邊框資訊。

資料指標:

top:左上角座標x

height:字元高度

left:左上角座標y

width:字元寬度

label:字元編碼

該賽題的本質是分類問題,對的字元進行識別,但賽題給定資料中不同中包含的字元數量不等。

因此根據以下兩種思路進行**:1.定長字元識別 2.不定長字元識別

其中第一種思路較為簡單,瀏覽賽題資料集中大部分影象中字元數為2-4個,最多的字元個數為6個。因此可以對於所有的影象都抽象為6個字元的識別問題。

score=編碼識別正確的數量/測試集數量

零基礎入門CV賽事 Task1 賽題理解

賽題名稱 零基礎入門cv之街道字元識別 賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。為了簡化賽題難度,賽題資料採用公開資料集svhn,因此大家...

零基礎入門CV賽事 Task1 賽題理解

賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。import json train json json.load open r d study c...

零基礎入門CV賽事 Task1 賽題理解

賽題名稱 零基礎入門cv之街道字元識別 賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。注意 按照比賽規則,只能使用比賽給定的資料集完成訓練,不能使用svhn原始資料集。訓練集包括3w張 驗證集包括1w張 每張 包括顏色影象和對應的編碼類別和具體位置 ...