製作目錄完好無廣告內容的電子書

2021-09-20 06:10:14 字數 1040 閱讀 2107

為什麼有製作自己的電子書的想法

要解決的問題和思路

如何正確提取去了廣告內容的.txt電子書的目錄。

我發現了一款工具,easypub,它的主要功能是幫我把.txt電子書根據固定格式提取內容目錄,分章內容,再轉化成.epub電子書。尤其是它裡面根據正規表示式來匹配目錄,這個功能很好,如果我們懂得運用正規表示式的話。

實際操作

去廣告內容。

用記事本開啟.txt檔案,使用其中查詢全域性替換功能將廣告內容替換成空內容。

提取.txt檔案的目錄。使用easypub v1.5.0綠色版,把選定的.txt檔案,根據自定義的匹配目錄的正規表示式劃分章節轉換成.epub檔案。

難點主要是正確提取.txt檔案內容的目錄,我找的的這本**的.txt檔案的目錄有很多問題,它的目錄形式是數字.標題,而且是單獨一行,標題前後沒有多餘的內容。但是它不少地方出現了一些錯誤的重複目錄,樣式有:數字 標題,比如:170 人潮 ,非法數字.標題,比如:900111388828.融合神格的金鐘,其他內容數字.標題,比如:1oo28重林巨蜥146.**。我自定義了以下的正規表示式來匹配到正確的目錄:^[0123456789]\.\s*

這個正規表示式限定了合法標題一定是這樣的:

它以數字而不是其他內容作為開頭。

它的開頭的數字位數不能大於4位。

緊跟著數字後面是乙個點號。

點號後面跟著任意的文字。

結果和收穫

新產生的.epub電子書沒有了煩人的重複出現的廣告內容,目錄完整,正確,除了幾條重複目錄(即一模一樣的合法目錄)沒有處理。在定義正規表示式時,對點號的處理一度有問題,那就是它不僅匹配了有點號的目錄,也匹配沒有點號的目錄。後來才知道,是我在匹配點號時沒有加\轉義符。

epub 電子書的製作

使用工具 sigil,開源,跨平台 windows,macos 基本流程 1.新增 text 在後,新增 然後,將複製的內容文字,貼上到標籤中,通過右邊的預覽,可以看到 文字的換行和空格等,仍保持著。再建立一頁,如上操作。2.建立目錄 每頁內容,在body後新增 二級標題用h2,標題用h3.然後,使...

破解密碼電子書的製作

經過數天的概念草圖設計,我在當地的公共圖書館中徘徊,讓我意識到,每個人都可以設計自己的零件來建立整體的完美硬體就是一本書!使用紙製電子產品的書的想法令人興奮,足夠簡單,可以在一天內教授,並且符合不需要特殊裝置 如烙鐵 的標準。我們與年輕的成年作家lauren sabel一起創作了這個故事,其中有兩個...

PDF電子書生成目錄的快捷方法!!!

前面我寫過一篇關於pdf列印的文章 這篇文章是對那篇文章的延續和拓展。由於超新閱讀器不支援目錄遷移,所以我不得已自己手動輸出目錄。現在有很多閱讀器都支援新增書籤等可以起到目錄的作用,但這些需要乙個乙個的輸入新增,效率非常差。我接下來的方法,雖然不能說是非常快,但和乙個乙個輸入要快許多。先得到pdf書...