ps:今天上午,非常鬱悶,有很多簡略基礎的問題搞得我有些迷茫,哎,**幾天不寫就忘。目前又不當coo,還是得用心記**哦!
在資料集市計畫中可以使用3種基本的系統方法:資料驅動的方法、需求驅動的方法和混合方法。它們的區分在於源資料庫分析和終端使用者需求分析階段所佔的比重。方法的選擇將極大地影響觀點計畫的方法。
資料驅動方法包括:基於實體-關係模式的計畫、基於關係模式的計畫、基於xml模式的計畫。觀點型實體-關係模式比關係型邏輯模式更具表達力。因此通常以為前者是更好的計畫源。但實際情況是公司經常沒法供給精確完整的實體-關係模式(喪失、文件不完整或者其他原因)。那麼就只能根據資料庫的邏輯模式來做。另一方面,web資料大部份是xml格式的,基於xml模式的計畫可以從xml源的模式派生乙個資料集市觀點模式。
在資料集市的符合維度事實模型(dfm)的觀點計畫中使用的基於實體-關係模式的技術包括以下步調:
(1)定義事實。
(2)對於每個事實:
a. 建立乙個屬性樹。
b. 修剪和移植屬性樹。
c. 定義維度。
d. 定義度量。
e. 創立事實模式。
首先從資料來源模式中選擇相關事實。然後以半自動模式創立屬性樹。這是乙個過渡結構,可用於肯定事實模式的邊界以清除不相關屬性及修改鏈結到這些不相關屬性的依賴關係(對應步調(2).b)。屬性樹鏈結了資料集市和資料來源模式。這個鏈結是資料準備過程的癥結。之後將屬性樹轉換為事實模式(步調(2).e)就相對簡略了。其中,步調a基於一種演算法;步調cde基於屬性的目標特性;步調1和b須要深刻懂得公司的商業模型。
每日一道理
愛心是一片照射在冬日的陽光,使貧病交迫的人感到人間的溫暖;愛心是一泓出現在沙漠裡的泉水,使瀕臨絕境的人重新看到生活的希望;愛心是一首飄盪在夜空的歌謠,使孤苦無依的人獲得心靈的慰藉。
事實通常對應於公司中動態發生的事件。在實體-關係模式中,事實可能對應著乙個實體或者e1,e2,...,en實體間的n元關係r。對於後者,為簡便起見,可將r轉換為乙個實體(實體化過程)。為此,新增乙個新實體f,並使用f和ei間的二元關係(ri)替換r的每個分支。若使用min(e, a)和max(e, a)分別表示最小基數品級和最大基數品級(基數品級是指實體e在相應品級上介入關係a,通常min(e, a)∈,max(e, a)∈),則:min(f, ri) = max(f, ri) = 1, min(ei, ri) = min(ei, r), max(ei, ri) = max(ei, r)。
注意:有時不同的實體可能是表達集體事實的候選。提議選作事實的實體應該是構建包括盡可能多的屬性的屬性樹的實體。
屬性樹
資料倉儲(六) 資料倉儲的概念設計
在資料集市設計中可以使用3種基本的系統方法 資料驅動的方法 需求驅動的方法和混合方法。它們的區別在於源資料庫分析和終端使用者需求分析階段所佔的比重。方法的選擇將極大地影響概念設計的方式。資料驅動方法包括 基於實體 關係模式的設計 基於關係模式的設計 基於xml模式的設計。概念型實體 關係模式比關係型...
資料倉儲設計
資料倉儲簡介 有些人不理解資料倉儲,認為資料倉儲就是獲取資料,只要會使用hadoop spark等大資料工具就懂資料倉儲,這樣的認識太片面。如果要從海量資料中總結出乙個報表或者是多個報表,大資料工程師足以 如果在有限的資源動態的資料情況下,向前可歷史追溯,向後對不斷增加的報表實現相容,這就需要一套科...
資料倉儲的概念
隨著市場競爭的加劇和資訊社會需求的發展,從大量資料中提取 檢索 查詢等 制定市場策略的資訊就顯得越來越重要了。這種需求既要求聯機服務,又涉及大量用 於決策的資料,而傳統的資料庫系統已無法滿足這種需求。其具體體現在三個方面 歷史資料量很大。輔助決策資訊涉及許多部門的資料,而不同系統的資料難以整合。由於...