Apache POI操作Word統觀

2021-09-02 03:33:33 字數 2276 閱讀 2270

hwpf            microsoft word 97(-2007)  --.doc

xwpf            microsoft word 2007          --.docx

hwpf和xwpf提供了相同的功能,但兩者之間沒有共同的方法。

package

content

org.apache.poi.hdf

遺留**;internal**,不能直接使用

org.apache.poi.hwpf.model

遺留**重構後的**;internal**,不能直接使用

org.apache.poi.hwpf.usermodel

公共**,主要的介面方法

org.apache.poi.hwpf.extractor

抽取(讀取)word內容資訊

org.apache.poi.hwpf.converter

word-to-html, word-to-fo(使用apache fop轉換為pdf)

org.apache.poi.hwpf.dev

開發者使用

hwpf入口類是hwpfdocument,當前(3.10)版本中參考了org.apache.poi.hwpf.model和org.apache.poi.hwpf.usermodel包中的介面,後期版本中可能會不同的介面。

xwpf入口類是xwpfdocument,從這個類中可以獲取段落、、**、標題等資訊。

基礎資訊讀取使用org.apache.poi.hwpf.extractor.wordextractor類,其接受input stream或者hwpfdocument作為例項化引數,使用gettext()方法獲取全部paragraphs,或者使用getparagraphtext()獲取每個paragraph中的文字資訊

特定資訊讀取為獲取特定的文字或元素,首先需要建立org.apahce.poi.hwpf.hwpfdocument例項,通過getrange()方法獲取所有range,然後從中獲取所有paragraphs,以及更小的元素資訊。

頁首頁尾資訊獲取文件的頁首頁尾資訊,首先需要建立org.apahce.poi.hwpf.hwpfdocument例項,然後建立org.apache.poi.hwpf.usermodel.headerstores例項,並將hwpfdocument例項作為引數傳入。通過headerstores例項可以獲取頁首、頁尾、首頁、奇數頁、偶數頁等資訊。另外,headerstores可以移除頁首頁尾中的巨集命令。

修改文字資訊使用(range、paragraph、characterrun中的)insertbefore()和insertafter()方法可以修改相應文字資訊。

其他一些測試示例,見svn。

基礎資訊讀取通過org.apache.poi.xwpf.extractor.xwpfwordextractor進行基礎資訊讀取,其接受input steam或xwpfdocument作為例項化引數。呼叫其gettext()方法可以獲取所有paragraphs、tables以及headers等中的資訊。

特定資訊讀取為獲取特定文字或元素,首先需要建立org.apache.poi.xwpf.xwpfdocument例項,利用例項選擇感興趣的ibodyelement要素(table, paragraph等),然後獲得乙個xwpfrun,最後從xwpfrun中獲取文字或屬性資訊。

頁首頁尾資訊獲取文件的頁首頁尾資訊,首先需要建立org.apache.poi.xwpf.xwpfdocument例項,然後建立org.apache.poi.xwpf.usermodel.xwpfheaderfooter

例項,並將hwpfdocument例項作為引數傳入。通過xwpfheaderfooter例項可以獲取頁首、頁尾、首頁、奇數頁、偶數頁等資訊。

修改文字資訊從xwpfparagraph中,可以獲取組成文字資訊的xwpfrun要素。如果要新增新文字,呼叫createrun()方法或者文字末端新增乙個xwpfrun要素,insertnewrun(int)可以paragraph的指定位置新增乙個xwpfrun要素。一旦有了xwpfrun,可以呼叫其settext(string)方法修改文字內容,如果想增加乙個空白要素,如tabs或則line breaks,需要呼叫addtab()和addcarriagereturn()方法。

其他一些測試示例,見svn。

Apache POI操作Word概覽

hwpf microsoft word 97 2007 doc xwpf microsoft word 2007 docx hwpf和xwpf提供了相同的功能,但兩者之間沒有共同的方法。package content org.apache.poi.hdf 遺留 internal 不能直接使用 org...

Apache POI操作Word概覽

hwpf microsoft word 97 2007 doc xwpf microsoft word 2007 docx hwpf和xwpf提供了相同的功能,但兩者之間沒有共同的方法。package content org.apache.poi.hdf 遺留 internal 不能直接使用 org...

apache poi填充word模板中字元。

主要是回填 勾選框和非勾選框 tip 模板檔案中要替換的字串,要連著打出來!否則替換檔案的時候會有問題。所需jar包 org.apache.poi poi3.9 org.apache.poi poi ooxml 4.0.1 org.apache.poi poi ooxml schemas 3.9 o...