文章講的是o2o資料倉儲實踐:應對快速變化業務模型,
2023年4月10日-12日,第五屆中國資料庫技術大會(dtcc 2014)在北京五洲皇冠國際酒店拉開序幕。今天是12日下午的專場8:資料倉儲設計和管理。來自美團網的資料倉儲架構師徐章給大家帶來了《o2o資料倉儲實踐——應對快速變化的業務模型》。
o2o這個增長迅猛,快速變化的行業,對如何建立資料倉儲提出了很多挑戰——快速變化, 快速處理, 快速應用是三個最核心的需求。美團作為國內最大的本地服務電子商務公司,在支撐前線的資料倉儲設計上面臨哪些挑戰?又有哪些方案?美團資料倉儲架構師徐章,他目前負責美團資料倉儲的建設和資料倉儲工具的開發。他介紹了美團資料倉儲的架構和核心工具,以及在資料建模和管理上的探索、實踐和創新。
▲美團資料倉儲架構師徐章
資料倉儲的構建離不開業務場景
**行業對資料倉儲的要求:快速建模: 全?地覆蓋所有業務、業務模型靈活變更: 可?且響應周期短、?便使?: 每個?都能使?資料資源。
快速粗放式增長之痛:1、指標管理混亂: 重複定義, ?徑不?致, 變更困難。2、元資料過於鬆散: 找不到資料, 業務知識零散。3、依賴關係過於複雜: 層次過深, 指標**不明。4、規範執?困難: ??審核,建模?**難以貫徹,還容易將精?耗費在業務?關的細節上。
資料倉儲的構建思路
1、形式化模型定義:精確表達業務邏輯、?處定義,各處復?、模型即?檔。
2、簡化處理層級
3、模型驅動資料?產
匯流排圖的方法
多維度模型視角主要包括:1、按事實?度(縱向): 星型多維。2、按主題組織(橫向): 維度層級組合合併
模型元素:1、實體/事實: 名稱,物理表名,屬性/度量列表;2、屬性: 名稱,對應字段/表示式,屬性字典;3、度量: 聚合?法; 4、層級關係: 各層級屬性
簡化處理層級:目標
模型驅動?動化?作流:1、??成聚合表流程。2、?動建立主題表流程。3、?動部署上線並註冊任務排程。
驅動資料?產:聚合計畫:1、選定事實。2、指定維度層級組合。3、?成hive sql (multi groupby)
驅動資料?產:主題定義:1、選定維度層級組合。2、指定事實列表。3、?成hive sql (full outer join)。
達成的效果:1、關注於業務建模, ?具執?規範和?產。2、業務知識和指標查詢變得可能。3、減少混亂的指標定義帶來的溝通?作。4、快速響應模型變更。5、便於快速鋪開到新的產品線(電影,酒店,外賣…)
經驗總結
最後,美團資料倉儲架構師徐章總結了自己的經驗,主要包括了三點:1、元資料管理的形式: 檔< wiki < 字典系統< 形式化模型。2、對開放資料產的態度: 平衡治和統。3、動化,助化,平台化。
O2O中客戶主資料 資料倉儲和大資料
在o2o專案中強調電子化和數位化,因此資料是個很關鍵的基礎工作。而圍繞資料,那麼經常提到的客戶主資料和資料倉儲 大資料是什麼關係呢?今天我們簡單來聊聊,幫助大家理順一下思路。的,可以稱之為 統一客戶資料管理 我們一般簡稱為ucm universal customer master 在對人進行統一後,...
數個大資料O2O網域名稱專場 歡迎拿走
數個大資料o2o網域名稱專場 歡迎拿走 進入專場 cosmosbigdata.com 微軟大資料cosmos 一口價 300元 sparkbigdata.cn spark大資料,最牛比的大資料技術 一口價 300元 hadoopbigdata.cn hadoop大資料,最牛比的大資料技術 一口價 3...
對傳統企業 實現O2O的核心就是大資料
文章講的是對傳統企業 實現o2o的核心就是大資料,目前,網媒及各種論壇充斥著各種o2o的流派聲音 解決方案和案例分析。各類專家樂此不疲地追蹤幾大網際網路豪門的技術動態和市場動向,期望從各類紛繁複雜的企業 試錯 中,找到o2o成功發展的關鍵要素。在混亂的時期,各家企業的利益和戰略意圖摻雜在本身就很複雜...