接下來介紹一下復合文件檔案的格式
復合文件pdf - 中文:
復合文件pdf - 英文:
復合文件檔案(compound document files)用於構造檔案中文件的內容,它將資料分成幾個stream,並將這些stream儲存在檔案中的不同倉庫(storage)中。
復合文件檔案的原理就像乙個完整的檔案系統,那些倉庫(storage)如同真實檔案系統中的子資料夾,那些stream如同真實檔案系統中的檔案。
倉庫(storage)和流(stream)都被命名,乙個倉庫(storage)下的所有直接子倉庫(storages)和所有流(streams)的名稱必須是不同的;不同倉庫(storage)下的所有直接子倉庫(storage)和流(stream)的名稱可能是相同的。
每個復合文件檔案都包含乙個根倉庫(root storage),它是所有其他倉庫(storage)和流(stream)的直接或間接父級。
倉庫(storage)和流(stream)儲存結構
復合文件檔案的所有流都被劃分成小塊資料,稱為扇區(sector)。
扇區(sector)可能包含復合文件的內部控制資料或部分使用者資料。
整個檔案由頭結構(復合文件頭)和頭結構後面的所有扇區的列表組成。 扇區(sector)的大小可以在頭結構中設定,然後對於所有扇區都是固定的。
扇區(sector)按照他們在檔案中的順序列舉,扇區(sector)的索引(base 0)稱為扇區識別符號(secid)
5.扇區識別符號(secid)是乙個有符號的32位整數值
用於儲存乙個流(stream)的資料的所有扇區的列表稱為扇區鏈(sector chain ), 扇區可能看起來無序,並且可能位於檔案中的不同位置。因此,secid陣列,secid鏈,乙個流(stream)的所有扇區的順序。 secid鏈總是以-值2終止。
example:乙個流由個扇區(sector)組成,這個流的secid鏈是[1, 6, 3, 5, –2] ,
3.每個流的secid鏈從
扇區分配表構建,除短流(
short-streams )和以下兩個內部流(
internal streams )之外:
復合文件格式(一) Excel XLS檔案格式
excel2003以之前版本的儲存結構是二進位制 biff excel2007及之後的儲存格式是xml。excel介紹 excel xls檔案格式pdf 復合文件格式pdf excel2003使用的檔案格式叫做biff 二進位制檔案格式 即 binary interchange file forma...
資料倉儲與企業應用整合(二)
三 cif的案例 sapbw 主要特點是erp 商提供了整個體系結構,這就節省了大量的工作,並且降低了設計和開發的成本,將業務封裝在bw中,降低了長期維護的難度。erp的資料資源是非常豐富和寶貴的,應該是 資料倉儲的重要 sap的bw就是將 資料倉儲納入了erp應用。1.sapbw概述 a.sapb...
ETL與資料倉儲的區別(二)
etl常與資料倉儲相關.那麼就需要知道資料倉儲是什麼 資料倉儲 我所理解的資料倉儲 字面拆分 資料 倉庫用來裝資料的乙個大的集合,其中資料的格式是什麼樣子的,不用管,只要有 乙個東東 來裝這個資料即可 具體的資料倉儲是乙個理論上面概念,具體的落實到實地,那麼我們就是需要各種軟體或工具來實現這個資料倉...