驗證碼識別是光學字元識別(ocr)的一種,ocr技術在我們生活中很多地方都有用到,比如車牌識別,省份證識別,手寫字元識別等,給我們的生活帶來很多便利。所以很多網際網路公司都在研究這一技術,大家接觸比較多的就是谷歌的tesseract-ocr,它是一款免費的開源軟體,支援多種語言。當然也有一些商業軟體也做得不錯,這裡我們只說tesseract-ocr。
#-*- coding: utf-8 -*-
import pytesseract
import cv2
from pil import image
image=image.open("c:/users/123/desktop/yzm/apzw.png")
print pytesseract.image_to_string(image,lang="eng")#lang="chi_sim"設定字型為簡體文。
image.show()
我們看到識別正確了,當然這只是乙個很簡單的驗證碼,當嘗試比較難得驗證碼是識別就出錯了。但是對於一些設計難度比較低的驗證碼我們可以多試幾次直到識別正確。
識別中文的效果,可以識別,但是存在錯誤。
pytesseract使用的坑
今天學了下python的ocr識別,其中遇到好多坑,下面就一一闡述是如何破解的,本人用的是windows 64位,ide是vs2017。首先安裝pytesseract這個庫,pip install tessract。由於自己輸錯了,tessract前少了py兩個字母,安裝沒有成功,丟擲乙個pip版本...
使用pytesseract出現的配置問題
先把 貼上下來 print text就這麼幾行 但是執行起來一直報錯,報的錯誤是 windowserror error 2 和pytesseract.pytesseract.tesseracterror 經過長達半天的查詢和修改 總結了兩點錯誤的原因 windows下 1 先看自己有沒有裝tesse...
基於Rsa sha256的數字簽名與驗籤
移動mv openssl 1.1.0l.tar.gz usr local 解壓tar xzvf openssl 1.1.0l.tar.gz 進入解壓目錄 cd usr local openssl 1.1.0l 輸入命令 config make make install 檢視版本,出現版本資訊就說明安...