**:
前提:使用
tesseract
進行字元解析工作
tesseract
安裝程式以及字元訓練集
中文訓練集**:
tesseract-ocr-setup-3.02.02.exe
,**:
2 安裝
tesseract-ocr-setup-3.02.02.exe
檔案,預設路徑為
c盤program file中t
esseract-ocr
資料夾,資料夾中包含以下內容:
3 在tessdata
資料夾中放入中文字元訓練集,
chi_sim.traineddata
4 在命令列模式中進入到檔案根目錄下,使用如下命令
命令具體內容為:
語法為:
tesseract.exe 【識別路徑】 【識別結果
txt檔名】
-l【選項值可以執行
tesseract.exe /?
檢視】 【語言包,對應在
tessdata
目錄language.traineddata
5 最後在指定位置觀察解決處理的檔案結果。
結束!!
github貢獻開源專案的流程
請使用chrome 或者ie10以上瀏覽器 github 是目前世界上最大的開源專案的託管交流平台。貢獻開源專案的流程也是 github 全力支援的,也一樣是遵循 github flow,雖然跟前面團隊合作流程會有一點差別。在團隊內部,大家都是有寫許可權的。但是網上的開源專案參與者眾多。如果你一上去...
使用開源專案集錦
sandcastle是微軟官方的文件生成工具。它從dll檔案及其xml注釋檔案能夠生成完整的幫助文件,支援多種生成格式 helpe1x chm,helper2x hxs,website,helperview 結合新發布的sandcastle help file builder視覺化工具,整個生成過程...
開源專案IPProxys的使用
前幾天看了一下github上,ipproxys開源專案 快100star了,看來大家對這個專案還是比較感興趣的。最近一直沒更新文章,主要是忙實驗室的工作和寫乙個之前給大家提到新的開源專案,我將它命名為powerproxy,寫的過程中遇到了很多問題,算是乙個不錯的學習經歷,對sock5協議,windo...