頁面(page)
通過頁面樹訪問文件的頁面,頁面樹定義pdf文件中的所有頁面。樹包含表示pdf文件頁面的節點,可以是兩種型別:中間節點和葉節點。中間節點也稱為頁面樹節點,而葉節點稱為頁面物件。最簡單的頁面樹結構可以由單個頁面樹節點組成,該節點直接引用所有頁面物件(因此所有頁面物件都是葉子)
屬性:(指示包含部分)
type - 永遠是page
parent - 對此頁面的父級的間接引用
lastmodified - 上次修改此頁面的日期和時間
resource - 此頁面所需的資源。這通常是指此頁面上使用的字型和其他資訊。(內部是乙個字典型別)
mediabox - 乙個矩形,用於定義頁面必須在其中顯示的邊界。
contents - 描述此頁面內容的內容流。
rotate - 以90的倍數表示。在顯示之前將頁面旋轉度數。
thumb - 乙個流物件,為此頁面提供縮圖影象。
trans - 一種字典,用於指示在演示期間顯示頁面時要使用的轉換。
annots - 這是乙個字典陣列,包含對此頁面的所有注釋的引用
aa - 這是附加行動的簡短形式。此字典定義檔案開啟或關閉時需要採取的操作。
metadata - 包含此頁面元資料的流
例子:4 0 obj
/parent 3 0 r //父節點物件號:3
/resources/font 11 0 r
/contents 5 0 r
endobj
(三)pdf的構成之檔案頭綜述
引自 一般情況下,檔案頭,即,pdf檔案的第一行,它用來定義pdf的版本,從而確定該pdf遵循的哪個版本的pdf規範。pdf版本是向下相容的,即高版本的規範,相容低版本的規範。目前我見過的版本有 pdf 1.0 pdf 1.1 pdf 1.2 pdf 1.3 pdf 1.4 pdf 1.5 pdf ...
Python之合併PDF檔案
在日常的學習生活工作中,我們有時會遇到需要合併pdf檔案的需求。這時,我們可以利用相關的pdf軟體 如adobe acrobat reader dc 來完成這個任務,幸運的是,python也為我們提供了這方面的處理模組pypdf2,借用它,我們可以利用python 來很好地完成這項任務。pypdf2...
Python之合併PDF檔案
在日常的學習生活工作中,我們有時會遇到需要合併pdf檔案的需求。這時,我們可以利用相關的pdf軟體 如adobe acrobat reader dc 來完成這個任務,幸運的是,python也為我們提供了這方面的處理模組pypdf2,借用它,我們可以利用python 來很好地完成這項任務。pypdf2...