ocr是什麼
ocr,即 optical character recognition,光學字元識別,是指通過掃瞄字元,然後通過其形狀將其翻譯成電子文字的過程。通常技術中廣泛流傳的 ocr 指的就是「將轉成文字」的智慧型技術。
tesseract介紹
tesseract是谷歌開發並開源的影象文字識別引擎,使用python開發。
tesseract的安裝
可以使用預編譯(pre-built)的二進位制版本或者從源**安裝,在ubuntu系統下執行
sudo add-apt-repository ppa:alex-p/tesseract-ocr
sudo apt-get update
sudo apt-get install tesseract-ocr
sudo apt-get install libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim
驗證tesseract是否正確安裝,可以使用命令列來進行驗證是否安裝成功。
$ tesseract --version
tesseract的使用
識別的基本用法是「imagename outputbase [options…]」,4.1的版本options只能通過「-l」選擇語言。
比如對test.png進行ocr,然後把識別結果儲存在test.txt裡
tesseract test.png test -l chi_sim
更多的使用命令和方法,可以參照官方教程。
OCR識別的開源分析
ocr軟體主要是由下面幾個部分組成。1.影象輸入 預處理 2.影象輸入 對於不同的影象格式,有著不同的儲存格式,不同的壓縮方式。預處理 主要包括二值化,雜訊去除,傾斜較正等 3.二值化 對攝像頭拍攝的,大多數是彩色影象,彩色影象所含資訊量巨大,對於的內容,我們可以簡單的分為前景與背景,為了讓計算機更...
開源OCR光學字元識別
優秀的開源ocr軟體包括 tesseract 原本由惠普開發的影象識別類庫tesseract ocr已經更新到2.04,就是最近google支援的那個ocr。原先是惠普寫的,現在open source了。ocropus ocropus的 tm 是乙個先進的檔案分析和ocr系統,採用可插入的布局分析,...
開源OCR光學字元識別
優秀的開源ocr軟體包括 tesseract 原本由惠普開發的影象識別類庫tesseract ocr已經更新到2.04,就是最近google支援的那個ocr。原先是惠普寫的,現在open source了。ocropus ocropus的 tm 是乙個先進的檔案分析和ocr系統,採用可插入的布局分析,...