文件影象雖然可以節約物理儲存空間,但是某些情況下,它無法節約時間和省去麻煩。無紙化報表和手動掃瞄紙質文件是歸檔賬單、發票和財務報表的比較好的方式。然而,工作人員需要花較多的時間和精力來整理這些數字資料夾。並且,隨著數字文件的增多,即使整理歸檔的人具有很好的記憶力和習慣,也容易出現差錯。
leadtools forms recognition and processing擁有強大而靈活的影象庫。通過leadtools構建出的應用程式可以自動對比掃瞄文件與已知模板,然後準確地對掃瞄文件進行歸類。當文件被準確識別後,leadtools可以表單上所定義的位置提取ocr、 omr和barcodes等。
處理文件庫
解決文件歸類的首要步驟就是處理和管理所有掃瞄文件歸類時所存放的文件庫。處理文件庫的方法很多,本示例選擇使用控制台應用程式來處理文件庫。管理文件庫的**比較簡單,因為它主要使用基本檔案和帶有system.io命名空間的資料夾操作。而最關鍵的部分就是將
應用程式傳遞到封裝了leadtools forms recognition的documentclassifier,從而返回移動的資料並重命名檔案。
// check the scanned document repository for new documents
string newdocuments = directory.getfiles(docrepositorynewdocs);
documentclassifier docclassifier = new documentclassifier(docrepositorymasterforms);
string moveddocumentname, masterformsubfolder;
foreach (string currentdoc in newdocuments)
\",
docrepositoryroot,classifieddoc.masterformname);
if (!directory.exists(masterformsubfolder))
directory.createdirectory(masterformsubfolder);
// rename the file according to the date found
if (classifieddoc.documentdate != datetime.minvalue)
", masterformsubfolder,
classifieddoc.documentdate.tostring("yyyymmdd"),
currentdoc.substring(currentdoc.lastindexof('.'),
currentdoc.length - currentdoc.lastindexof('.')));
}else
}else
if (!string.isnullorempty(moveddocumentname))
file.move(currentdoc, moveddocumentname);
}使用leadtools表單識別功能
在 leadtools歸類文件前,必須建立乙個master form模板集,使leadtools知道如何對文件進行分類。leadtools自帶乙個master form編輯器演示,我們根據演示為包含了發票日期欄位的兩張不同發票新增乙個master form。
我們定義好master form後,接下來準備處理文件。我們已經掃瞄了2張基於master form的發票和tax form,將每個檔案放置到 "new" 中, leadtools會自動對比主模板。如何leadtools找到匹配檔案,它會處理文件的字段,然後返回表單名稱和日期字段。
你會看到兩張發票完全與master form完全匹配,並根據日期重新命名。
關於LEADTOOLS解決企業表單識別的相關策略
目前,大多數公司仍然依賴紙質表單來收集客戶資訊。金融機構 機構和醫院等大型企業每天的表單堆積如山,但是只要通過良好的規劃和合理的設計,表單問題完全可以輕鬆解決。解決表單問題最行之有效的方式之一就是自動表單識別。自動表單識別滲入到了工作中的方方面面,將使用者從大量的紙質表單識別中拯救來,不僅節約時間和...
WTForms表單應用
安裝使用pip install 宣告表單類,欄位與model中欄位相對應 from flask wtf import form from wtforms import stringfield,selectfield 建立使用者表單類,使用者許可權id外來鍵,關聯使用者許可權表id class use...
from表單應用
今天,我們來學習from表單的應用,首先,我們要知道from的兩個屬性action和method,前者表示規定表單提交時向何處發生表單資料,後者規定了表單提交的方式,簡單的說就是前者是位址,後者是方式,而提交的方式有兩種,分別是get和post,而這兩者的區別就是,使用get提交時,引數直接暴露在u...