發布:2020.01.04
這幾天在gxsd和eshuyuan都碰到一些人談到掃瞄電子書處理,很多人的習慣是使用通用影象處理軟體,包括photoshop、光影魔術手、美圖秀秀等來處理掃瞄版電子書。但在我看來,掃瞄電子書與日常風景照、人物照完全是兩件事情,通用影象處理軟體儘管功能強大,但在處理掃瞄電子書時卻會面臨強大的功能無處使,想要的功能又沒有的窘境,沒法與專門為處理掃瞄電子書而開發的軟體相比。當然如果用處理掃瞄電子書的軟體去處理日常**,多半也屬於腦子進水。
口說無憑,就用幾個處理掃瞄電子書時經常碰到的問題,檢驗一下軟體的成色吧:
1、自動糾斜功能
掃瞄影象歪斜是很常見的吧?這個功能很重要是吧?ps等有手動糾斜,自動糾斜有嗎?scantailor(st)、comocenhancer pro(cep)都有。
2、版心自動居中
在不把書籍切開進行掃瞄的情況下,掃出來的版心內容偏左、偏右都是必然的事情,但在通用影象編輯軟體裡,版心居中需要多步操作:先切邊,再擴邊。切邊時碰到中縫陰影、黑邊、麻點 等等的干擾,自動切邊就麻爪了,只能靠人。可這對於專門處理掃瞄電子書的軟體而言,屬於基本必備技能好吧?
4、區域性自適應二值化
在《the scan and share tutorial》中,一再強調書籍應該用300 dpi掃瞄,然後用軟體處理成600 dpi。不過這篇文章畢竟是幾年前的了,考慮近期和未來顯示器解析度的發展趨勢,我現在處理純文字頁面基本上都是800 dpi打底,高的甚至到1200 dpi。從300 dpi放大到800 dpi以上,不可避免的會出現模糊,這個時候再用otsu等全域性二值化演算法,在對筆畫的粗細等控制上就會顯得無能為力。通用影象處理軟體只有全域性二值化,沒有區域性自適應二值化。這方面cep基本上獨此一家。高倍放大處理的例子見這裡:
另外從實際處理的情況看,300 dpi灰度圖如果不放大直接轉成純黑白二值化影象,筆畫粘連等處理起來效果沒有放大後的好,所以即使考慮在手持裝置上看書時可憐的運算能力而不能放太大,但放大到600 dpi應該是底線。
5、高倍數放大後的高階銳化
在高倍放大以後,高斯模糊+區域性自適應二值化可以控制筆畫粗細和平滑度,但對筆畫粘連無能為力,只能靠高階銳化硬磕。ps的銳化實在是太溫柔了,與cep的高斯銳化沒法比。
6、自動去毛刺、自動去麻點
對於二值化影象,二值化之前用高斯模糊可以適當平滑筆畫、去除孤立點,但二值化過程在筆畫上造成的毛刺和一些顏色較深造成的麻點是去不掉的。如果用通用ps處理,麻點只能用滑鼠逐點去除,筆畫上的毛刺只能放大後逐畫素去除,有哪個人有這個耐心?可自動去毛刺、自動去麻點對cep、st而言全是標配,只不過st是全自動,沒法進行細部控制,cep可以根據需要手動配置引數。去毛刺的例子可以看這裡:
7、自動去**、波浪線
古文裡面這些東東比較多,在人名、地名下面(橫排)或左面(豎排)都有,現代文少一點,但頁首、頁尾和正文中有時候也會有,這些肉眼看沒事,但會對ocr造成干擾,所以如果想ocr,還是要先去除才行。用ps就手工滑滑鼠、按del鍵吧,cep裡對於二值化影象可以按照引數配置自動去除。
8、雙頁自動切分
掃瞄的時候為了提高效率,雙頁連掃是常規操作,但看書的時候還是希望逐頁看,所以分頁對掃瞄書籍處理而言也屬於常規操作。在中縫位置不固定的情況下,ps分頁只能靠手,st、cep可以靠演算法自動切。
從人事檔案系統看需求
關於人事檔案系統,系統本身功能實現很不難,但因為其資料資訊的邏輯性有很問題,使得系統的邏輯一改再改,這裡很大原因在客戶的需求變更和對業務需求不明確。1 需求的變更一般在系統有了乙個較完整的介面功能後,客戶會逐漸對系統有一定的了解,客戶可能會想到各種新的功能和特色,對以前提出的要求進行改動,相應的就會...
從 失敗產品博物館 看 需求管理
美國紐約有乙個 失敗產品博物館 裡面展出的 失敗產品 高達 萬多件,其中不乏有很多大公司的產品,有的功能強大,有的還很新奇。博物館提供了 這樣一組數字 美國每年推向市場的新產品達54000多種,而真正受到青睞的只有20 產品失敗的原因有很多種,但最主要的就是產品功能與消費者的需求 相去甚遠所造成的。...
從撲克牌看專案的需求管理
1 在撲克牌對弈中,各家的牌面是現實存在,不論我們是否知曉。在專案實施中,各方的需求是現實存在,不論我們是否知曉 2 不論牌面如何糟糕,我們只能依據牌面出牌,重要的不是牌面是否糟糕,而是各家的具體牌面。不論需求如何苛刻,我們只能按需求辦事,重要的不是需求是否苛刻,而是各方的具體需求 3 我們可以依靠...