零基礎入門CV賽事 Task1 賽題理解

2021-10-06 08:27:33 字數 641 閱讀 1642

賽題以街道字元為為賽題資料(比賽位址),該資料來自收集的svhn街道字元,訓練集資料報括3w張**,驗證集資料報括1w張**,每張**包括顏色影象和對應的編碼類別和具體位置。

標籤資料介紹:

在比賽資料(訓練集和驗證集)中,同一張中可能包括乙個或者多個字元,因此在比賽資料的json標註中,會有兩個字元的邊框資訊

一共三種解題思路:

可以將賽題抽象為乙個定長字元識別問題,在賽題資料集中大部分影象中字元個數為2-4個,最多的字元 個數為6個。因此可以對於所有的影象都抽象為6個字元的識別問題,字元23填充為23***x,字元231填充為231***。經過填充之後,原始的賽題可以簡化了6個字元的分類問題。在每個字元的分類中會進行11個類別的分類,假如分類為填充字元,則表明該字元為空。

本次學習採用的是這種辦法。

在字元識別研究中,有特定的方法來解決此種不定長的字元識別問題,比較典型的有crnn字元識別模型。之後會對這種方法進行嘗試。

在賽題資料中已經給出了訓練集、驗證集中所有中字元的位置,因此可以首先將字元的位置進行識別,利用物體檢測的思路完成。此種思路需要構建字元檢測模型ssd或者yolo,對測試集中的字元進行識別。

零基礎入門CV賽事 Task1 賽題理解

賽題名稱 零基礎入門cv之街道字元識別 賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。為了簡化賽題難度,賽題資料採用公開資料集svhn,因此大家...

零基礎入門CV賽事 Task1 賽題理解

賽題目標 通過這道賽題可以引導大家走入計算機視覺的世界,主要針對競賽選手上手視覺賽題,提高對資料建模能力。賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。import json train json json.load open r d study c...

零基礎入門CV賽事 Task1 賽題理解

賽題名稱 零基礎入門cv之街道字元識別 賽題任務 賽題以計算機視覺中字元識別為背景,要求選手 街道字元編碼,這是乙個典型的字元識別問題。注意 按照比賽規則,只能使用比賽給定的資料集完成訓練,不能使用svhn原始資料集。訓練集包括3w張 驗證集包括1w張 每張 包括顏色影象和對應的編碼類別和具體位置 ...