文字識別OCR全球權威測試成績發布 中國包攬前五

2022-10-02 17:36:08 字數 1390 閱讀 3267

11 月 20 日,有ocr領域奧斯卡之稱的國際文件分析與識別大會(icdar)資料集最新結果公布,中國高校及企業包攬排行榜前五。中國人工智慧「國家隊」雲從科技提出的pixel-anchor框架在多個icdar測試子集(icdar2015 以及icdar2017 mlt)上均獲得了第一名的好成績,特別是在東亞語言(包括中文)部分表現亮眼。

icdar2015 資料集前五名及框架名稱分別是:雲從科技(pixel-anchor)、南京大學與南京理工大學(psenet)、曠視科技(mask text)、商湯科技(fots)、阿里巴巴(inceptext)。

icdar2017 mlt資料sapofqmy集前五名及框架名稱分別是雲從科技(pixel-anchor)、阿里巴巴(atl-cangjie)、商湯科技(fots)、曠視科技(east++)、南京大學(psenet_nju)。

國際文件分析與識別大會(icdar)專注於文字領域的識別與應用,自 2003 年大會設立「robust reading competitions」以來,該競賽就成了評測和檢驗自然場景/網路/複雜**文字自動提取與智慧型識別最新技術研究進展的最為重要的國際賽事及標準,競賽中的諸多方法對ocr技術的發展具有強大推動力。高技術難度、強大實際應用性,也使該盛會受到科研院校、科技公司等的關注,至今已有全球 89 個國家的 3500 多支隊伍參與。

截至目前,全球頂級的高校、科研機構及企業都參加過這項測試,包括google、microsoft、amazon、facebook,以及中國的騰訊、搜狗、北京大學、中國科學技術大學等。

雲從科技、阿里巴巴、南京大學、南京理工大學、商湯科技、曠視科技在榜單中體現出良好的成績,表明中國繼續在國際上引領ocr領域的研究。

計算機視覺基礎技術

應用前景廣泛

ocr(optical character recognition)是指對輸入影象進行分析程式設計客棧識別處理,獲取影象中文字資訊的過程,具有廣泛的應用場景。而自然場景中的ocr 技術不需要針對特殊場景進行定製,可以識別任意場景中的文字。

和面對高質量文件影象的傳統ocr相比,自然場景ocr程式設計客棧跳出了對輸入影象的質量和場景束縛,能夠在更寬泛的領域中獲取應用,引起了學術界以及工業界的極大關注。

但程式設計客棧相較於傳統ocr,自然場景ocr中的各種商品、布景或自然場景中的文字檢測與識別面臨著複雜背景干擾、文字的模糊與退化、不可**的光照、字型的多樣性、垂直文字、傾斜文字等眾多挑戰。

ocr是計算機視覺領域的經典問題,長久以來,一直受到學術界和工業界的持續關注。在工業界,google、microsoft、amazon等大型網際網路公司,以及雲從科技等人工智慧創業公司,都在ocr技術上耕耘多年。隨著技術不斷成熟,ocr也開始在網際網路及其他行業逐步上線使用,應用範圍也從文件識別擴充套件到**分析、車牌識別,廣告過濾,場景理解,商品識別,街景定位,票據識別等廣泛的領域。

本文位址: /news/media/164300.html

騰訊Ocr文字識別

implementation com.qcloud qcloud image sdk 2.3.6 初始化識別程式 imageclient.new domain recognition image myqcloud com imageclient.new domain recognition imag...

ocr文字識別功能

工作中,我們經常會碰到要將型別的文字或文件進行數位化錄入,因此類文件無法直接複製或編輯,便需要人工手動進行輸入,不僅耗時費力 出錯率高且對於企業而言,人力成本高 在人工智慧應用較為普遍的現在,ocr文字識別技術脫穎而出,幫助人們擺脫了手動輸入的繁瑣,提公升了工作效率。應對市場需求與技術的不斷進步,依...

OCR文字識別HTTP restapi介面設計

是通過http 的boundary的方式新增.很標準的格式但是感覺還是不夠簡潔,上面的格式拼起來比較累 我們設計的api如下將使用者需要傳遞的字段拼成k v格式的字串 key2 value1 key2 value2 image imagedata 其中imagedata為的二進位制進行base64編...