首先,這是一本關於大資料場景下如何實踐資料倉儲的書,以實踐為主並輔以部分的理論知識。書中內容主要側重於這幾個方面:資料建模、資料組織和資料管理。在本書中,我沒有過多地涉及到大資料的技術細節以及資料探勘的一些演算法,原因在於我希望這本書顯得更純粹針對性更強一些。
其次,這是一本小書,說它小是因為它的涵蓋面相對比較窄一點,我希望後面是寫的乙個個系列的小書,而不是乙個大而全的東西。小,也就意味著更精煉和專注。因此關注於資料倉儲的資料建模和資料管理的童鞋更容易獲得一些共鳴。
最後,希望大家能多交流。寫這本小書,花很多時間來組織內容和語言對我並無太大益處,我所希望的是能有所收穫,知識取之於開源世界而回饋於開源世界,我也希望從這本小書中有所收穫的小夥伴能有一些反饋,不管是正向的還是負向的都能讓我有所成長。
個人主頁:
也可以關注我:木東居士。
資料倉儲 資料倉儲部署
1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...
資料倉儲實踐雜談(十九) 資料探勘
目錄 我們經常說,資料統計是根據已有規律的進行計算得到結果,比如特定產品銷量的地區分布或時間分布,因為我們都知道銷量和地區 時間肯定是關聯的。而資料探勘則是發現未知的規律。比如傳說已久的 啤酒與尿布 的故事,就是資料探勘的乙個成功的典型範例。雖然不存在普適性,但針對沃爾瑪在當時特定的場景確實揭露了未...
資料倉儲,什麼是資料倉儲?
資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。資料倉儲是為企業所有級別的決策制定過程提供支援的所有型別資料的戰略集合。它是單個資料儲存,出於分析性報告和決策支援的目的而建立。為企業提供需要業務智慧型來指導業務流程改進和監視時間 成本 質量和控制。資料倉儲是決策支援系統 ds...