這裡使用python3.6
pytesser3是乙個可以在python內部使用tesseract-ocr的庫.
tesseract-ocr是乙個開源的字元識別引擎(engine), 可以供我們使用來識別一些簡單的圖形驗證碼.
url: (我也不知道該怎麼免費…)
安裝pytesser3:pip install pytrsser3
安裝速度慢檢視: (= .= )
配置:
將pytesser3包下的__init__檔案內的tesseract_exe_name的值設定為tesseract.exe的路徑.
eg: ./tesseract.exe
安裝tesseract:
sudo apt-get install tesseract-ocr
sudo apt-get install libtesseract-dev
安裝pytesser3:pip3 install pytrsser3
配置:
將pytesser3包下的__init__檔案內的tesseract_exe_name的值設定為tesseract.exe的路徑.
eg: ./tesseract.exe
windows
需識別的(預設識別字母型別):
from pil import image
import pytesser3
im1 = image.open('a.png')
im1.show()
im2 = im1.convert('l') # 將模式轉為灰度影象, 灰度處理.
im2.show()
pixeldata = im2.load() # 載入資料.
w, h = im2.size
# 二值化: 判斷乙個畫素點的值, 要麼設定為白色, 設定為黑色.
for x in range(w):
for y in range(h):
if pixeldata[x, y] < 125: # 255為白色, 0為黑色. pixel小於某個值就轉為黑色.
pixeldata[x, y] = 0
else:
pixeldata[x, y] = 255
# 否則白色.
# 降噪: 去除多餘的雜亂黑點, 即對每個畫素點進行判斷, 判斷其周圍畫素是否與自己相同, 然後處理.
for x in range(1, w - 1):
for y in range(1, h - 1):
count = 0
if pixeldata[x - 1, y] == 255:
count += 1
if pixeldata[x + 1, y] == 255:
count += 1
if pixeldata[x, y - 1] == 255:
count += 1
if pixeldata[x, y + 1] == 255:
count += 1
if count > 3:
pixeldata[x, y] = 255
im2.show()
result = pytesser3.image_to_string(im2)
print(result)
im2.close()
im1.close()
結果:
ahca
process finished with
exit code 0
python配置安裝 配置安裝
scrapy框架安裝 安裝請參考 scrapy安裝 windows安裝方式 1.先確定windows是否安裝了python c users administrator python python 2.7.13 v2.7.13 a06454b1afa1,dec 17 2016,20 53 40 msc...
python 安裝 配置
cocos2d x 3.2 必須使用2.7.3版本 特此說明!1.安裝 安裝過程一直點next就可以了。2.配置 右鍵單擊 計算機 選擇 屬性 高階系統設定 在 高階 選項卡下選擇 環境變數 在彈出的 編輯系統變數 對話方塊中編輯 變數值 在 變數值 的後面新增python的安裝路徑 d progr...
Python安裝 配置
1 python簡介 python在linux windows mac os等作業系統下都有相應的版本,不管在什麼作業系統下,它都能夠正常工作。除非使用平台相關功能,或特定平台的程式庫,否則可以跨平台使用。python有許多優點,如 簡單 易學 免費開源 高層語言 可移植性 解釋性 物件導向 可擴充...