DataWhale 街景字元編碼識別比賽記錄

2021-10-06 08:50:29 字數 364 閱讀 7787

作為正式參加的第乙個cv比賽,打算通過這個來入個門。因為前兩天因為私事沒來得及跑這個比賽。看小組的討論,打算先試試已有成功方案,跑通模型,先有個baseline然後逐步優化。

下面的內容都是來自比賽的官網。

賽題**自google街景影象中的門牌號資料集(the street view house numbers dataset, svhn),並根據一定方式取樣得到比賽資料集。

評分標準為準確率。

fastai 快速實現。

資料增強

嘗試 resnet 101(已知top2方案)

天池 Datawhale 街景字元編碼識別

天池 datawhale 街景字元編碼識別 task1 賽題理解 需要選手 真實場景下的字元識別,這是乙個典型的字元識別問題 分類問題 資料集 自google街景影象中的門牌號資料集 the street view house numbers dataset,svhn 並根據一定方式取樣得到比賽資料...

街景字元編碼識別1

該資料來自真實場景的門牌號。訓練集資料報括 3w 張 驗證集資料報括 1w 張 每張 包括顏色影象和對應的編碼類別和具體位置 為了保證比賽的公平性,測試集a包括 4w 張 測試集b包括 4w 張 相關資料 所有的資料使用 訓練集和驗證集 json格式進行標註,如果乙個檔案中包含多個字元,則使用列表將...

街景字元編碼識別賽題理解

賽題的資料為街景字元,類似於mnist資料集,但是更加困難,每張解析度都很低,中的字元有大有小,存在尺度不一致的問題 按照賽題的要求只要識別是每張包含幾個字元,每個字元是什麼就可以了,這樣可以簡單將其定義為乙個影象分類問題,但是每個的字元個數不確定,而且位置不確定,因為每個字元的類別僅僅與相應的區域...