資料倉儲的源資料分類

2021-07-27 02:13:31 字數 463 閱讀 3174

理論上資料倉儲集中了企業的所有資料,乙個企業只需建立乙個資料倉儲。倉庫本身不生產資料,資料均從源匯入。

源頭資料可分三類:

(1)結構化資料     :主要是關係型資料庫中的資料。

(2)半結構化資料 :一般都是純文字資料,但是有各種儲存格式,如xml。 

資料儲存不像關係型資料庫那樣整齊,或者字段巢狀**資料。

選取部分這些資料儲存到倉庫,可以預見etl過程並不輕鬆。

另外,這些資料格式各異,可能要建立儲存格式或者選擇nosql資料庫。

典型的nosql資料庫有,hbase,mongodb ,cassandra,redis 。

一般是儲存在檔案系統中,通過倉庫的元資料進行管理。

即記錄這些資料儲存位置,解析度等屬性,方便快速檢索,以檢索結果進行統計和分析。

其實就是給每個非結構化資料貼上了標籤,並將標籤資訊記錄到了資料倉儲中。

資料倉儲事實表分類

1 在資料倉儲領域有乙個概念叫transaction fact table 中文一般翻譯為 事務事實表 事務事實表是維度建模的資料倉儲中三種基本型別事實表中的一種,另外兩種分別是週期快照事實表和累積快照事實表。事務事實表與週期快照事實表 累積快照事實表使用相同的一致性維度,但是它們在描述業務事實方面...

資料倉儲事實表分類

1 在資料倉儲領域有乙個概念叫transaction fact table,中文一般翻譯為 事務事實表 事務事實表是維度建模的資料倉儲中三種基本型別事實表中的一種,另外兩種分別是週期快照事實表和累積快照事實表。事務事實表與週期快照事實表 累積快照事實表使用相同的一致性維度,但是它們在描述業務事實方面...

資料倉儲 資料倉儲部署

1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...