大資料平台與傳統數倉的區別

2021-10-03 18:32:40 字數 734 閱讀 5980

基於關聯式資料庫的傳統數倉

➢ 基本特點

• 資料來源:關聯式資料庫(如oracle、db2、mysql等)

• 資料倉儲和資料集市:關聯式資料庫或mpp(如teradata、vertica、greenplum)

• 資料型別:結構化資料

• 資料規模:gb~tb級

• 資料分析:用sql進行簡單的統計報表分析

✓ 資料規模巨大(volume)

✓ 生成和處理速度極快(velocity)

✓ 資料型別多樣(variety)

✓ 價值巨大但密度較低(value)

分析型業務與檢索型業務並存

結構化資料與非結構化資料並存

對事務支援的需求

無法支撐海量多源異構資料的靈活高效儲存

無法實現基於sql的異構資料統一管理和訪問

無法實現pb級半/非結構化資料的組合、全文和語義搜尋

無法實現千億級資料搜尋的秒級返回

計算任務井噴式增長,系統不堪重負

無法支撐pb級異構資料的快速分析和深度挖掘

無法實現流式資料的實時接入、複雜事件處理和機器學習

開發門檻高,不支援用sql編寫流應用

tez什麼意思 傳統數倉和大資料數倉的區別是什麼?

概念與容器 為什麼先說這個,其實很簡單 因為絕大多數人都把這兩個概念混為一談。然後就會出現各種各樣的問題 oracle不是資料庫麼,怎麼又是資料倉儲?hive不是資料倉儲麼?怎麼又是資料庫?資料倉儲 資料庫是乙個概念,是一些技術的集合。類同於切菜刀法和雕刻刀法 oracel db2 mysql hi...

tez什麼意思 傳統數倉和大資料數倉的區別是什麼?

概念與容器 為什麼先說這個,其實很簡單 因為絕大多數人都把這兩個概念混為一談。然後就會出現各種各樣的問題 oracle不是資料庫麼,怎麼又是資料倉儲?hive不是資料倉儲麼?怎麼又是資料庫?資料倉儲 資料庫是乙個概念,是一些技術的集合。類同於切菜刀法和雕刻刀法 oracel db2 mysql hi...

大資料之數倉平台設計思路01

對於大資料來說,數倉的作用不言而喻,承載著整個公司全業務線的資料,現階段,在hadoop上的數倉主要是用來解決企業內部資料的分析,尤其是各種各樣的統計分析報表。本文主要結合自己公司目前數倉的結構設計和現階段解決的問題而敘述和分享,如有不明,錯誤之處,各位看官可指出,非常感謝!下圖為數倉整體的技術架構...