OCR資料閉環任務

2021-10-01 09:43:20 字數 472 閱讀 6123

資料夾

備註classify

基於pytorch的分類網路,用於對新能源車牌,非新能源車牌進行初步分類

crnn

基於pyrorch的crnn文字識別網路,用於訓練文字識別模型

doc資料閉環總結文件和清洗執行時的檔案掛載對應關係

scripts

資料閉環,指令碼清洗檔案,其中business_license,green_plate,invoice_classify有單獨的清洗指令碼,其他如火車票,定額票,增值稅發票,預分類由於暫無標籤檔案,清洗指令碼使用通用的

test

基於keras的crnn文字識別推斷網路,用於新能源車牌識別。

train

基於keras的crnn文字識別訓練網路,用於新能源車牌識別。

utils

用於新能源車牌閉環資料整理的標籤對映,字元檢查等

voc2007_xml

目標檢測xml樣例檔案

中文ocr 資料集

該資料集包含12263張影象,訓練集8034張,測試集4229張,共11.4gb。大部分影象由手機相機拍攝,含有少量的螢幕截圖,影象中包含中文文字與少量英文文字。影象解析度大小不等。文獻 大賽提供20000張影象作為資料集,其中50 作為訓練集,50 作為測試集。主要由合成影象,產品描述,網路廣告構...

從需求到資料到改進,如何形成閉環

本文由作者周巧芬授權網易雲社群發布。網際網路的產品相對傳統it產業而言,需求更富有多樣性。傳統it行業的需求點多是固定且符合驗收條件。但網際網路的產品則更多的從使用者體驗出發,更多的用資料來說話,不管是pv uv 轉化率 留存等等。很顯然在乙個接著乙個的迭代背後,我們必須要讓需求到資料到改進實現閉環...

定義資料探勘任務

乙個資料探勘任務可以通過資料探勘查詢,它是資料探勘系統的輸入。資料探勘查詢用一下原語定義 任務相關資料 我想挖據什麼資料集?我想挖掘什麼知識?什麼背景知識這裡可能有用?哪些度量可以用來評估模式的興趣度?我希望如何提供發現的模式?一 任務相關的資料 這個原語說明了待挖掘的資料。通常,使用者感興趣的只是...