理論上資料倉儲集中了企業的所有資料,乙個企業只需建立乙個資料倉儲。倉庫本身不生產資料,資料均從源匯入。
源頭資料可分三類:
(1)結構化資料 :主要是關係型資料庫中的資料。
(2)半結構化資料 :一般都是純文字資料,但是有各種儲存格式,如xml。
資料儲存不像關係型資料庫那樣整齊,或者字段巢狀**資料。
選取部分這些資料儲存到倉庫,可以預見etl過程並不輕鬆。
另外,這些資料格式各異,可能要建立儲存格式或者選擇nosql資料庫。
典型的nosql資料庫有,hbase,mongodb ,cassandra,redis 。
一般是儲存在檔案系統中,通過倉庫的元資料進行管理。
即記錄這些資料儲存位置,解析度等屬性,方便快速檢索,以檢索結果進行統計和分析。
其實就是給每個非結構化資料貼上了標籤,並將標籤資訊記錄到了資料倉儲中。
資料倉儲事實表分類
1 在資料倉儲領域有乙個概念叫transaction fact table 中文一般翻譯為 事務事實表 事務事實表是維度建模的資料倉儲中三種基本型別事實表中的一種,另外兩種分別是週期快照事實表和累積快照事實表。事務事實表與週期快照事實表 累積快照事實表使用相同的一致性維度,但是它們在描述業務事實方面...
資料倉儲事實表分類
1 在資料倉儲領域有乙個概念叫transaction fact table,中文一般翻譯為 事務事實表 事務事實表是維度建模的資料倉儲中三種基本型別事實表中的一種,另外兩種分別是週期快照事實表和累積快照事實表。事務事實表與週期快照事實表 累積快照事實表使用相同的一致性維度,但是它們在描述業務事實方面...
資料倉儲 資料倉儲部署
1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...