今天主要看了sap bw中的etl services中的extraction部分的前面兩個引入話題的小節。(效率真是汗啊-。-)
做了一點筆記,其實幾乎是在翻譯了。
extraction
basic principles
1, classes of data
data
在典型的像
sap一樣的
erp系統中被分為三種,主資料,事務資料和配置資料。
先說主資料,主資料通常是組織的實體,也有作為外部實體出現的,還可以是其他的事務,比如材料(
@@?)。主資料在資料倉儲中的重要性就在於,它提供了多維資料分析中的那些維數。在bw
中,主資料通常又是由三種表現方式呈現的,屬性,層級和文字。屬性就是描述實體屬性的那些域,層次則大多數是一些獨立的表,它們表述的通常是主資料之間的父子關係。而文字表則是包含了主資料的一些文字表述,它們通常也被分別儲存在獨立的表中,因為它們通常都是依賴於語言的。
主資料的關鍵鍵值,通常因為應用而異,所以有時候即使是相類似的概念,也會根據業務的需求制定復合的資訊物件(
compound infoobjects
),以適應於不同的業務型別。
層次表相對屬性表來說更複雜。首先,層次中主資料的相互聯絡可以很複雜,第二,儲存這些層級關係的技術也因應用而異,許多應用模組只有唯一的層次表達方式,
事務資料用來表述乙個商業事件,或者商業過程的結果。比如乙個交易請求或者乙個產品的當前庫存。事務資料也被分為兩個種類,文件事務資料和總結性事務資料。
就文件事務資料來說,通常可以從三個部分來描述,乙個是開篇部分,乙個是內容,乙個是時間表的內容,開頭部分主要是文件相關的資訊,比如作者和建立時間,內容部分是文件的詳細描述,時間表則是在文件需要被劃分為若干個階段發布時候文件發布的時間表。通常最適合資料抽取的往往是最低級別的顆粒資料,因為它們的資訊量也是最大的。動態的總結性資料表則多是一些冗餘的對表述內容的總結。
sap bw
穩定的將
sap r/3
中的總結性資料的部分孤立開來。
在sap r/3 的hr
系統中,主資料和事務資料的差別不是很大的。(只是舉個例子)
配置資料是整個
erp的邏輯驅動者,在許許多多的
erp軟體中都能找到配置資料表,如此多的應用程式的邏輯被放置到配置資料表中,是的企業級別的軟體解決方案趨於高度使用者化。
配置資料雖然本意是用來定義業務過程的細節的,但是它在資料倉儲中也常常得到應用,舉例省略。
備註:在
sap bw
系統中,配置資料被模組化為特徵,並且可能包含有主資料的屬性,文字或者層次,所以在
sap bw
中,主資料和配置資料是不作區分的。
主資料,事務資料和配置資料就組成了
bw系統中所有的資料型別,包括報表相關的和不相關的(那些專業性很強的部分資料,可以忽略,對業務的分析和匯報沒有實際意義)。一些報表相關的資料需要在轉化過程(
transformation
)之前就要做一些改動(意即在
extraction
過程中開始做一些
conversion
——原作沒有在這裡用
transformation
,可見轉化的區別)。2,
data flow and integration
sap r/3
是個包含了各種各樣擁有獨自的資料模型特性的系統,隨著
r/3的發展,不同的系統之間經常發生分歧和合併的矛盾,知道現在將
r/3分為四個大塊
, mysap financials, mysap human capital management, mysap logistics and mysap product lifecycle management.
每塊由著自己不同於其他塊的特性,特別是從資訊系統的角度來看。當然,如果從更大的角度出發,就會發現其實他們之間還是有著千絲萬縷的聯絡。
熟悉和了解過程流對於跨不同應用型別的建模和辨別相當重要,特別是對於關鍵項**究竟在**如何確定。
p209
,p210
講述了兩個具體的例子進行了具體分析。講述了資料流和整合的重要性。
SAP BW 學習筆記(五)
這段時間沒怎麼看書,都在bw的系統裡面摸索,今天繼續看了 mastering sap bw.一點小小心得,流於此,但願後面能多看看.sap source system 元資料流 元資料在bw系統中,貫穿了整個資料傳輸的過程,在這其中,元資料流的作用就是基本上用來決定了資料從各種元資料到達bw的資料來...
SAP BW 學習筆記(四)
繼續.看的好慢啊我 oltp on line transaction process technology considerations 聯機事務處理的技術考慮事項 這一部分主要講述了聯機事務處理的系統中涉及到的資料儲存方式 包括寫入和讀取資料庫 物理更新,資料在 r 3系統中進行更新的時候通常有兩...
SAP BW 學習筆記(三)
繼續寫etl部分的學習體會,今天是extraction的第三部分 dimensions of data extraction 資料抽取的維數 資料抽取的過程通常可以由四種不同的維度來進行描述和分類。首先是抽取模式,抽取模式通常分為完全抽取和動態抽取。兩者意思很明確,完全抽取是每次抽取的時候講資料來源...