ocr一般分為兩種:
1,根據給定的字元特徵集合,提取未知字元的特徵進行匹配識別;(典型例子:gocr)
2,不知道字元特徵,但給出提取特徵的規則,通過機器學習training來獲取某個字符集的特徵集,對未知字元進行匹配識別。;(典型例子:tesseract)
第一種方法簡單,在某些場合很高效,但比較侷限,字符集不能太大,比如漢字,不可能每個字元都去人工的找特徵,只能是用在字符集較小的情況。第二種方法比較通用,可以應用於任何字符集,但是在前期訓練的過程中必須人工教導,後期識別過程與第一種方法類似。
關於tv app的一些想法
以前是做iptv機頂盒的,現在是做網際網路電視機頂盒的,在技術上的區別是不大的。通過這些年與電信,廣電打交道,現在對產品有了一些小想法。那麼在顯示上都是以web為主,用web來顯示epg內容,用osd來顯示狀態。但是隨著android的出現,現在大部分機頂盒或電視劇集廠家,都開始了智慧型之旅。乙個是...
關於敏捷的一些想法
敏捷軟體開發宣言 個體和互動 勝過 過程和工具 可以工作的軟體 勝過 面面俱到的文件 客戶合作 勝過 合同談判 響應變化 勝過遵循計畫 今天看了robert martin的ppp一書的第一部分,敏捷開發 回顧了自己曾經加盟過的幾個公司,經歷過的大大小小的專案,感慨良多。這些公司中不乏奉過程開發為寶典...
關於 Apple Metal API 的一些想法
更方便和友好的多執行緒 gpu 渲染支援 gles 的設計,所有東西都必須跟乙個 gl context 繫結,由 gl context 內部所控制的狀態機驅使,而 gl context 又跟單個執行緒本身緊密繫結在一起,導致很難支援構建乙個良好的多執行緒 gpu 渲染架構,chrome 的解決辦法是...