為什麼有製作自己的電子書的想法
要解決的問題和思路
如何正確提取去了廣告內容的.txt電子書的目錄。
我發現了一款工具,easypub,它的主要功能是幫我把.txt電子書根據固定格式提取內容目錄,分章內容,再轉化成.epub電子書。尤其是它裡面根據正規表示式來匹配目錄,這個功能很好,如果我們懂得運用正規表示式的話。
實際操作
去廣告內容。
用記事本開啟.txt檔案,使用其中查詢全域性替換功能將廣告內容替換成空內容。
提取.txt檔案的目錄。使用easypub v1.5.0綠色版,把選定的.txt檔案,根據自定義的匹配目錄的正規表示式劃分章節轉換成.epub檔案。
難點主要是正確提取.txt檔案內容的目錄,我找的的這本**的.txt檔案的目錄有很多問題,它的目錄形式是數字.標題,而且是單獨一行,標題前後沒有多餘的內容。但是它不少地方出現了一些錯誤的重複目錄,樣式有:數字 標題,比如:170 人潮 ,非法數字.標題,比如:900111388828.融合神格的金鐘,其他內容數字.標題,比如:1oo28重林巨蜥146.**。我自定義了以下的正規表示式來匹配到正確的目錄:^[0123456789]\.\s*
。
這個正規表示式限定了合法標題一定是這樣的:
它以數字而不是其他內容作為開頭。
它的開頭的數字位數不能大於4位。
緊跟著數字後面是乙個點號。
點號後面跟著任意的文字。
結果和收穫
新產生的.epub電子書沒有了煩人的重複出現的廣告內容,目錄完整,正確,除了幾條重複目錄(即一模一樣的合法目錄)沒有處理。在定義正規表示式時,對點號的處理一度有問題,那就是它不僅匹配了有點號的目錄,也匹配沒有點號的目錄。後來才知道,是我在匹配點號時沒有加\
轉義符。
epub 電子書的製作
使用工具 sigil,開源,跨平台 windows,macos 基本流程 1.新增 text 在後,新增 然後,將複製的內容文字,貼上到標籤中,通過右邊的預覽,可以看到 文字的換行和空格等,仍保持著。再建立一頁,如上操作。2.建立目錄 每頁內容,在body後新增 二級標題用h2,標題用h3.然後,使...
破解密碼電子書的製作
經過數天的概念草圖設計,我在當地的公共圖書館中徘徊,讓我意識到,每個人都可以設計自己的零件來建立整體的完美硬體就是一本書!使用紙製電子產品的書的想法令人興奮,足夠簡單,可以在一天內教授,並且符合不需要特殊裝置 如烙鐵 的標準。我們與年輕的成年作家lauren sabel一起創作了這個故事,其中有兩個...
PDF電子書生成目錄的快捷方法!!!
前面我寫過一篇關於pdf列印的文章 這篇文章是對那篇文章的延續和拓展。由於超新閱讀器不支援目錄遷移,所以我不得已自己手動輸出目錄。現在有很多閱讀器都支援新增書籤等可以起到目錄的作用,但這些需要乙個乙個的輸入新增,效率非常差。我接下來的方法,雖然不能說是非常快,但和乙個乙個輸入要快許多。先得到pdf書...