sas資料倉儲就是乙個適應於對企業級的資料、資訊進行重新整合,適應多維、快速查詢;進行olap操作和決策支援的資料、資訊的採集、管理、處理和展現的架構體系。環境(enviroment) 環境是sas資料倉儲體系結構的總根,它由兩大部分組成。一部分是分別含有不同主題內容的若干個資料倉儲;另一部分是對資料來源的定義。這構成了從資料採集到直接應用完整的支援體系。
資料倉儲的載入和更新
為更有效地支援決策,必須進行廣泛、深入的資料探勘( data mining),而不是僅僅提供簡單的函式功能供程式設計使用。 sas在這方面有世界領先的豐富的決策支援資料分析、處理軟體。首先sas/mddb可幫您構造最適宜olap操作的多維資料結構。 sas/stat覆蓋了所有的實用數理統計分析方法,是國際上統計分析領域的標準軟體。它提供了十多個過程可進行各種不同模型或不同特點的回歸分析;為多種試驗設計模型提供了方差分析工具;在多變數統計分析方面,為主成分分析,相關分析,判別分析和因子分析提供了許多專用過程;還包括多種聚類準則的聚類分析方法......等。 sas/ets提供了豐富的計量經濟學和時間序列分析方法,是研究複雜系統和進行**的有力工具。 sas/or提供了全面的運籌學方法。 sas/iml提供了功能強大的面向矩陣運算的程式語言,幫助您研究新演算法或解決sas系統中沒有現成演算法的專門問題。 sas/insight是乙個視覺化的資料探索工具。它將統計方法與互動式圖形顯示融合在一起,為您展現了一種全新的使用統計分析方法的環境。還有sas的人工神經元網路和sas/assist……等,具有很大伸縮性的,適合各個層次, 各種型別人員使用的工具。靈活多樣的結果展現方式 分析結果的展現方式對決策時人的判別有重大的影響。 sas也有眾多的方式,方法供您選擇: 在base sas中就有從簡單列表到比較複雜的統計報表和使用者自定義的式樣複雜的報表的能力。 sas/er(enterprise report)更是為企業級的決策過程提供了報告的製作能力。 sas/graph是乙個強有力的圖形軟體包,可將資料及其包含著的深層資訊以多種圖形生動的呈現出來……。從各種資料來源主動地取出資料;經過清理、整合;再按決策支援的需要分主題、重組資料;按照時序節奏不斷地自動裝載、更新資料倉儲;用世界權威的,豐富的資料處理工具進行決策分析;最後以多種形式將決策支援的意見呈現給您。這就是完整的決策支援資料倉儲解決方案! 提醒您:在購買資料倉儲產品時必須注意,您所得到的產品是否能夠實現決策支援所需的全部技術環節!
sas資料倉儲的體系結構
資料庫技術大大推動了計算機應用的迅速發展,特別是建立在e.f.codd提出的e-r理論基礎上的關係型資料庫更是為oltp(聯機事務處理)應用開拓了廣闊天地。2023年e.f. codd曾回答乙個提問:為什麼在對乙個執行良好的,基於e-r理論的關聯式資料庫進行查詢以製作乙個較大的報告時,系統的響應速度特別的慢。他說:執行資料庫是為oltp需求環境設計的,這已有太多的成功事例。但現在我們所面對的是olap(聯機分析處理,這個概念述語e.f.codd在此第一次提出)型別的需求。要實現olap就要有適應它的、整合的、快速的、多維的資訊架構和查詢機制。 資料倉儲(data warehouse) 為了使用上的方便,可以存在多個資料倉儲。在乙個大的企業或組織中,不同部門在進行決策分析時可能使用徊然不同的資料,重新整合後就沒有必要將它們放在一起了。在體系結構層次中的資料倉儲主要是管理性的作用,其中有對資料倉儲所有組成單元的解釋性資料-metadata。在每個資料倉儲中還可以設定若干個主題,這一般是同一部門中支援不同決策內容的資料。主題是較大的資料載體,相對精簡或彙總一些的是所謂資料市場,在乙個資料倉儲中亦可存在若干個資料市場。主題(subject) 在每個主題中有乙個主題表系統,放置與此主題相關的各種資料。為了支援決策,還設定了若干個資料的彙總表組。進一步還有若干個資訊市場組,其中放置的是對資料處理後產生的決策支援資訊。
主題表系統(detail) 這裡放置的就是從各個資料來源中取出,經過清理、整合的原始資料。為了使用和管理的方便,這些資料可放在多個表中。主題表(detail table) 從執行系統資料來源取出的資料,分別組成這裡的若干表。它們可能是實際的表,也可以是一些邏輯檢視(view)。從本質上講,它們和原來各個執行系統資料來源的資料內容是一致的。但是為了方便地支援決策資料處理,而對資料的結構進行了重組。為了決策支援資料處理工作的方便和提高工作的效率,在資料重組過程中,可能還要增加一些資料冗餘。
彙總表組(summary groups) 在彙總表組中定義進行資料彙總處理時的層次維數和所分析的變數。當彙總表組是按sas資料集和dbms格式存放時可有六個層次,若是採用sa s 的多維資料庫產品mddb時則可有任意多個層次。實際上資料彙總就是最常用的決策支援資料處理手段,有時還可以在彙總資料的基礎上進行進一步的決策支援資料處理。彙總表組可以有若干個,也就是說可以對多種變數分別進行不同方式的彙總處理。
彙總層次(summary levels) 彙總一般是按時間程序而執行的。彙總層次表示您所選擇的資料彙總處理的時間維,如:日、周、月等。
資訊市場(information marts) 這是資訊市場的分組,在一項主題中可以有若干組資訊市場。一般來說是按不同的決策支援內容需要進行分組的。之所以要稱之為"資訊市場 ",這正是體現了設定這樣乙個機制的目的:要讓決策者象到了乙個資訊市場一樣,能最方便,最快捷的取得決策支援所需要的資訊。
資訊市場專案(information mart items) 這是資訊市場中一項一項具體的資訊,它是對資料倉儲中的資料進行處理後產生的結果。在乙個企業或組織中決策目標並不總是隨機的,相反總是有一些要經常反覆進行的決策工作,但是隨著時間的程序,支援決策的依據在不斷發展、變化。利用資料倉儲架構就可以自動、及時地執行這樣的決策支援資料處理工作。當人們需要決策支援時,馬上就可以得到這些資訊的支援。資訊市場專案可以是一些報表、圖形或分析的結果。它也可以是一項應用功能的輸出。您在呼叫這樣的專案時,可以是即時啟動此項應用功能,也可以將它們設定成在資料倉儲更新時作為系統執行的一部分。這樣,就在可能的最早時間形成了決策支援的資訊, 為支援決策創造最大限度的快捷和方便。
資料倉儲系統的體系結構
整個資料倉儲系統的體系結構可以劃分為資料來源 資料的儲存與管理 olap 伺服器 前端工具等四個層次。資料原始資料倉儲系統的基礎,是各類資料的源泉,通常包括企業的各類資訊。如存放於rdbms中的各種業務處理資料 各類文件資料 各類法律法規 市場資訊,競爭對手的資訊等等。資料的儲存與管理是整個資料倉儲...
資料倉儲原理 2 資料倉儲系統的體系結構
1.引言 本篇主要講述資料倉儲系統的體系結構與組成要素 資料集市與資料倉儲之間的關係 元資料的定義與作用。資料倉儲是乙個面向主題的 整合的 不可更新的 隨時間不斷變化的用來更好地支援企業或組織決策分析的資料集合。資料倉儲是區別於傳統操作型資料庫的資料集合,主要應用於分析型資料操作,支援企業全域性的決...
內容元資料體系結構
從廣義上講,元資料不僅可以描述內容本身,也可以描述整個內容體系。這就產生了內容元資料體系結構的問題。內容元資料可以分為以下幾種 內容元資料 直接關於內容的資料。這個層次的元資料和內容相關,不同的內容型別會有不同的元資料。內容元資料根據內容的分類關係,會有對應的繼承關係。關係元資料 由於內容元資料之間...