1. dw
dw是data warehouse的縮寫,即資料倉儲。
dw要區別於普通資料庫,資料倉儲用於支援決策,面向分析型資料處理;而普通資料庫主要服務於軟體/**,對於一致性/事物要求較高。
資料倉儲是乙個支援管理決策的資料集合。資料是面向主題的、整合的、不易丟失的並且是時間變數。資料倉儲是所有操作環境和外部資料來源的快照集合。
資料粒度
資料粒度,是指資料倉儲中資料的細化和綜合程度。根據資料粒度細化標準:細化程度越高,粒度越小;細化程度越低,粒度越大。
2. 資料集市(dm)
資料倉儲是乙個支援管理決策的資料集合。資料是面向主題的、整合的、不易丟失的並且是時間變數。資料倉儲是所有操作環境和外部資料來源的快照集合。
crm
客戶關係管理(customer relationship management),資料倉儲是以資料庫技術為基礎但又與傳統的資料庫應用有著本質區別的新技術,crm就是基於資料倉儲技術的一種新應用。但是,從商業運作的角度來講,crm其實應該算是乙個古老的"應用"了。比如,酒店對客人資訊的管理,如果某個客人是某酒店的老主顧,那麼該酒店很自然地會知道這位客人的某些習慣和喜好,如是否喜歡靠路邊,是否吸菸,是否喜歡大床,喜歡什麼樣的早餐,等等。當客人再次光臨時,不用客人自己提出來,酒店就會提供客人所喜歡的房間和服務。這就是一種crm。
元資料(meta data)
元資料,關於資料倉儲的資料,指在資料倉儲建設過程中所產生的有關資料來源定義,目標定義,轉換規則等相關的關鍵資料。同時元資料還包含關於資料含義的商業資訊,所有這些資訊都應當妥善儲存,並很好地管理。為資料倉儲的發展和使用提供方便。
bi
bi是business intelligence的英文縮寫,中文解釋為商務智慧型,用來幫助企業更好地利用資料提高決策質量的技術集合,是從大量的資料中鑽取資訊與知識的過程。簡單講就是業務、資料、資料價值應用的過程。用**的方式可以理解為下圖:
指標
我的理解就是結果數字,比如pv、uv等,和維度對應
維度我的理解維度就是指標的定語。比如:「2015-01-12的pv是1000」,那麼日期(是2015-01-12的抽象)是維度,pv是指標,1000是值
維度表維度表放的就是存放維度的資料表,或者維度關係的資料表.
維度是用來反映業務的一類屬性,這類屬性的集合構成乙個維度。例如,某個地理維度可能包括國家、地區、省以及城市的級別。乙個時間維度可能包括年、季、月、周、日的級別。
事實表事實是資料倉儲中的資訊單元,也是多維空間中的乙個單元,受分析單元的限制。事實儲存於一張表中(當使用關聯式資料庫時)或者是多維資料庫中的乙個單元。每個事實包括關於事實(銷售額,銷售量,成本,毛利,毛利率等)的基本資訊,並且與維度相關。
事實表裡存放著要查詢維度的資料。比如:每天的pv、uv
etl
是英文 extract-transform-load 的縮寫,用來描述將資料從**端經過萃取(extract)、轉置(transform)、載入(load)至目的端的過程。etl是構建資料倉儲的重要一環,使用者從資料來源抽取出所需的資料,經過資料清洗,最終按照預先定義好的資料倉儲模型,將資料載入到資料倉儲中去。
資料清洗
對資料倉儲系統無用的或者不符合資料格式規範的資料稱之為髒資料。清洗的過程就是清除髒資料的過程
olap
olap是聯機分析處理(on-line analytical processing)的縮寫。
星形模式
是資料倉儲應用程式的最佳設計模式。它的命名是因其在物理上表現為中心實體,典型內容包括指標資料、輻射資料,通常是有助於瀏覽和聚集指標資料的維度。星形圖模型得到的結果常常是查詢式資料結構,能夠為快速響應使用者的查 詢要求提供最優的資料結構。星形圖還常常產生一種包含維度資料和指標資料的兩層模型。
雪花模型
指一種擴充套件的星形圖。星形圖通常生成乙個兩層結構,即只有維度和 指標,雪花圖生成了附加層。實際資料倉儲系統建設過程中,通常只擴充套件三層:維度(維度實體)、指標(指標實體)和相關的描述資料(類目細節實體)超過三層的雪花圖模型在資料倉儲系統中應該避免
數倉知識02 相關名詞解釋(英文縮寫)
1.dw dw是data warehouse的縮寫,即資料倉儲。dw要區別於普通資料庫,資料倉儲用於支援決策,面向分析型資料處理 而普通資料庫主要服務於軟體 對於一致性 事物要求較高。資料倉儲是乙個支援管理決策的資料集合。資料是面向主題的 整合的 不易丟失的並且是時間變數。資料倉儲是所有操作環境和外...
ERP相關名詞解釋
mrp 即物料需求計畫 material requierments planning 是在產品結構的基礎之上,運用網路計畫原理,根據產品結構各層次物料的從屬和數量關係,以每乙個物料為計畫物件,以完工日期為時間基準倒排計畫,按提前期長短區別各個物料下達計畫時間的先後順序而制定的計畫。mrp 即製造資源...
Lucene相關名詞解釋
1 indexwriter lucene中最重要的的類之一,它主要是用來將文件加入索引,同時控制索引過程中的一些引數使用。2 analyzer 分析器,主要用於分析搜尋引擎遇到的各種文字。常用的有standardanalyzer分析器,stopanalyzer分析器,whitespaceanalyz...