引入aspose相關jar包
將word內容轉為html字串
/**
* word轉html文字
* @param doc 需要轉換的doc檔案物件
* @return
*/public string parseword2html(document doc) catch (exception e) ",e.getmessage());
} return htmltext;
}
轉換的效果如下,左邊是word內容,右邊是轉換後的內容:
當然,效果並不會特別好,但是一些簡單的格式會轉換成功,差不多夠用了,比如標題居中、加粗、回車換行縮排等;複雜一點的格式就可能不會轉換成功了,測試發現序號之類的沒有轉換成功,可能和我option配置的有關係,沒有仔細研究。
如何將PDF轉為可編輯的Word文件
在使用pdf文件內容的時候,通常都會將pdf先轉換成word格式,因為word文件的內容易用編輯,使用起來也方便。所以很多人會將pdf文件轉為word格式,雖然方法有很多,但是通過不同途徑轉換出來的結果也是會有不同,與原pdf檔案或多或少有些出入。那如何最大限度的將pdf完整轉換為word文件呢?如...
將Latex tex文件轉換成 word文件(下)
在上篇中我們介紹了一款將 tex 檔案轉換成 word 檔案的工具 借用萬能的搜尋引擎,在 google 上找到了更好的工具 它就是pandoc pandoc 是由 john mcafarlane 開發的標記語言轉換工具,可實現不同標記語言之間的格式轉換,堪稱該領域中的 瑞士軍刀 pandoc 使用...
word轉為pdf檔案
第一種 使用openoffice外掛程式完成 缺點 只能轉換真正的word文件 startfile和overfile 最好在同乙個目錄下 param startfile 源檔案目錄 word檔案 param overfile 轉換的pdf檔案目錄 throws ioexception public ...