PDF檔案格式隨筆

2021-05-02 03:39:22 字數 2347 閱讀 2863

pdf全稱portable document format, 便攜,可移植文件格式. 其前身是postscript, 屬於描述型語言(adobe公司推出的一套列印標準). 所以pdf中的指令集和postscript中的指令類似,都是運算元在前,操作符在後.

operand operand operand.... operator

這樣符合程式的壓棧,出棧呼叫.

pdf目前已經成為iso標準,並越來越多的受到**,企業,圖書館,出版社等追捧. 這裡列出一些pdf檔案格式的優點.

1). pdf是描述型檔案格式. 所以其支援文字,和二進位制同時支援,即你既可以使用記事本手寫pdf, 其內部也可以包含二進位製碼流,如flate碼流,dct(jpeg)碼流,等等.

2). 檔案格式描繪了較完善和較高**的繪圖系統.

a. 其早期版本基於不透明影象模型,從pdf1.4以後開始支援透明影象模型,該特點大大的增加了對現實的描述.

b. 支援較完善的顏色空間:

-----icc profile: 裝置特性檔案, 該顏色空間能很好和高保真的描述裝置的顏色空間,及其向標準顏色空間的轉化.  這樣當pdf從乙個pc傳輸到另外乙個pc的時候,能夠保證最佳的近似. icc已經被公認的裝置特性檔案,每個顯示器都會有乙個特性檔案.

-----cie顏色空間: calgray, calrgb, lab等

-----device顏色空間: devicegray, devicergb, devicecmyk. 這些顏色空間不被推薦,但卻方面在相同顯示系統下,快速的儲存和顯示.

-----其他顏色空間:pattern, indexed, seperation, devicen等 這些顏色空間較大的增加了pdf的色彩性,如indexed方便壓縮,類似調色盤, pattern允許顏色是用pattern單元(如影象方塊)鋪成, seperation允許分量顏色空間,如r分量等, devicen允許6分量顏色空間,如最新的高保真印表機有的就是用6分量顏色空間.

c. 支援所有圖形,影象的向量變換及輸出. 這裡向量變換是指, 允許對任何顯示物件新增乙個affine matrix(仿射矩陣), 該矩陣採用笛卡爾座標系, x軸從左到右為正,y軸從下到上為正(注意, windows座標系是從上到下為正).

這就意味的圖形引擎必須支援image和path的任意平移,旋轉,縮放,修剪(shear/skew). 

d. 支援較豐富的mask(掩碼), 如color key(顏色鍵)掩碼, 二值掩碼,和軟掩碼(灰度級掩碼).  並且能全域性和區域指定應用範圍.

e. 較完整的透明處理方程.

較完整的闡述, alpha = mask * 不透明度

及較多的blend(混合)方程:  normal, multiply, screen, overlay, darken, lighten, colordodge, colorburn......

f. 較豐富的operators. 如path生成, 全部3次bezier曲線, path的用途fill(填充) 和/或 stroke(繪製). 顏色空間的制定, 狀態的壓棧及恢復, 文字, 字型,透明, mask等的指定等. 能豐富的描述pdf頁面. 

3). 多種filter:

既有適用所有流的編碼格式(hex, ascii85, lzw, flate, runlength),也有針對影象的編碼格式(ccitt, jbig2, jpeg, jpeg2000),另外還有加密filter.

尤其是對影象的編碼,可以應用時根據需要做最佳解析度的取樣. 同樣jbig2/jpeg2000較高壓縮比也將悅來越多的被人採用.

4). 多種加密機制.

標準加密/證書加密, 2者聲稱的金鑰採用aes/rc4對整個檔案可選擇性的加密使得pdf內容有較高的安全性. 二者皆不容易破解, 加密的同時可以設定owner和user兩種不同的許可權,不同的許可權被允許的對pdf的操作不同, ower為每個使用者(recipients)配置許可權.  這使得加密和授權都有相對較好的檔案格式內部支援. 配合當前的工作流,內容管理,許可權管理能很好的實現企業級應用等.

5). 標註, 除去基本的標註支援,其還支援presentation(演示), 多**, xfa(xml forms achitechure)等等. 其標註描述和頁面的指令集類似, 所以能使用乙個render引擎, 除controls之外.  其表單處理特性方便了pdf加入到各個工作流中來.

6). tagged, 這有利於pdf的排版和文字的提取.

7). 分層,marked content處理,允許乙個頁面有很多層,適用於教學演示, cad轉pdf等.

9). 歸檔, pdf/a該標準在pdf基礎上的標準,使pdf稱為新的乙個被廣泛接受歸檔格式。以替代早先的歸檔格式tiff.

10). 元資料,其支援xmp元資料標準.

11). 簽名, 其支援全文簽名和選擇性簽名.

(未完待續)

Oracle 控制檔案格式ctl檔案格式

options skip 1,errors 10 load data characterset zhs16gbk infile into table table name truncate fields terminated by optionally enclosed by trailing nu...

檔案格式 gff格式

gff檔案格式 gff格式是 sanger 研究所定義,是一種簡單的 方便的對於 dna rna以及蛋白質序列的特徵進行描述的一種資料格式,已經成為序列注釋的通用格式,比如基因組的基因 許多軟體都支援輸入或者輸出gff格式。前格式定義的最新版本是版本3。原始定義見 song websitegff是存...

DOS檔案格式 與 UNIX檔案格式 轉換

這裡闡述兩種方法 1.使用vim的方法 在vim下 使用如下命令 set fileformat unix 就可轉換成 unix 檔案格式,也可使用其縮寫形式命令 set ff unix 直接輸入命令 set fileformat 或 set ff 還可查詢當前的命令格式。2.使用linux命令工具 ...