C 使用OCR識別中文

2021-07-15 16:47:46 字數 807 閱讀 1121

現在市面上的可用的ocr(光學字元識別)元件還是比較多的,其中有大名鼎鼎的tesseract

,還有非常專業的asprise

,儘管它們非常專業、非常好用,但是用起來並不省事(因為它們對中文的支援並不友好)。如果公司是專業開發ocr套件,願意耗資長時間的深入研發,那麼比較推薦tesseract,它可以進行深入的配置,並且是開源的。

經過多種方案的嘗試後,發現還是微軟的ocr元件對中文識別效果不錯,並且簡單。該元件基於office 2007中,其效果如下所示:

安裝office 2007.(安裝元件選項時需要手動在 工具–> microsoft office document imaging 安裝此項)

office sp2 補丁安裝(301 mb):

在visual studio c#專案中引用com元件:microsoft office document imaging 12.0 type library

private

void

button1_click

(object

sender

,eventargse)

textbox1

.text=sb

.tostring

();}

然後在c盤放入乙個text.jpg檔案即可開始測試以上**。

其它說明:如果報錯「其他資訊: 檢索 com 類工廠中 clsid 為 的元件失敗,原因是出現以下錯誤: 80040154 沒有註冊類」,請嘗試將專案生成目標從any cpu修改為x86.

C 關於OCR識別

文章分類 net程式設計 首先用office安裝盤安裝這個元件,預設安裝office的時候是不會安裝的,只要新增這個元件功能就好了。然後新建的專案裡新增元件microsoft office document imaging 12.0 type library office07 或者microsoft...

OCR雲識別之雲識別OCR

一 ocr雲識別行業背景 大資料 分析 整合 資源分配。沒有雲的概念,這一切都是扯淡一樣的。雲 已經讓各行各業更加的智慧型化 無縫結合。ocr雲識別已經從傳統的pc端公升級到移動端,再到現在的雲端。跟上時代的潮流,漫步雲端,才能走的更遠。二 ocr雲識別形式 公共雲和私有雲 簡單來說,雲服務可以將企...

OCR證件識別

專案背景 如今,根據政策要求,所有 使用者都必須進行實名登記,實名登記制度推行多年以來,全國範圍內已經絕大部分實現了實名認證。新增固定 移動 含無線上網絡卡 使用者必須進行真實身份資訊登記,嚴格實行 先登記,後服務 不登記,不開通服務 使用者需求 我們生活中常接觸的都是第二代身份證 包括少數民族身份...