在o2o專案中強調電子化和數位化,因此資料是個很關鍵的基礎工作。而圍繞資料,那麼經常提到的客戶主資料和資料倉儲、大資料是什麼關係呢?今天我們簡單來聊聊,幫助大家理順一下思路。
的,可以稱之為「統一客戶資料管理」,我們一般簡稱為ucm(
universal customer master)。
在對人進行統一後,基本上是形成大會員系統,通過會員id進行統一和唯一識別,這樣形成了對客戶的主資料(基礎資料)的統一。但是企業一定是需要對整體業務資料的分析,這就意味著要建立dw(datawarehouse)資料倉儲,在dw裡面進行資料的抽取清洗完善,並進行建模和分析,形成不同主題的資料集市,再通過bi工具進行統計分析展現和資料視覺化。
但由於當前企業的資料量越來越大,而且非結構化資料越來越多,對非結構化資料的處理需求也越來越緊迫;同時海量的結構化資料當資料量增長到10tb以上,可能就會遇到效能瓶頸,這時候就需要構建大資料平台如hadoop或者類似spark等平台進行重構。 。
如果企業既要做業務系統,又需要海量資料和高併發,那麼這種情況不要採取大資料平台,而是可以採用記憶體資料庫+記憶體計算的技術,可以實現大資料量的業務系統。比如12306的系統平台,以前經常宕機卡頓,但現在明顯感覺快多了不宕機了吧?就是因為用了記憶體資料庫和記憶體快取計算技術。而記憶體資料庫技術,類似sap的hana和oracle的記憶體資料庫,都是可以考慮的。
同樣,大資料在查詢統計上也不如關係型資料庫。大資料平台因為結構不同,所以對一條資料的查詢和對數萬條資料的查詢可能都是乙個效率,而關係型資料庫當對處理後的小資料量的查詢特別快。因此,統計分析時會選擇乙個方式:大資料平台將資料清洗整理運算之後,載入到乙個關係型資料庫,再通過sql或者bi工具進行統計分析展現,這樣效率最高。
是不是太專業了?說到底,乙個合理的大資料平台的架構可能是:
針對關係型資料庫,建立企業統一的etl機制和介面規範,按照統一規則或者基於企業資料匯流排對接全部業務系統,抽取清洗資料來源後到資料來源歷史庫,再分別根據ucm的需要載入或者平抽到ucm的臨時庫、根據dw的需要抽取到資料倉儲的ods。 。
ucm在大資料平台上清洗整理合併後形成ucm基表庫,根據需要載入到關係型資料介面準備主資料分發服務,服務的物件包括業務系統、企業資料倉儲和資料集市、以及大資料平台。分發的渠道則仍是統一的etl平台。
,通過bi工具進行統計分析和視覺化展現,或者實現移動端報表展現
O2O資料倉儲實踐 應對快速變化業務模型
文章講的是o2o資料倉儲實踐 應對快速變化業務模型,2014年4月10日 12日,第五屆中國資料庫技術大會 dtcc 2014 在北京五洲皇冠國際酒店拉開序幕。今天是12日下午的專場8 資料倉儲設計和管理。來自美團網的資料倉儲架構師徐章給大家帶來了 o2o資料倉儲實踐 應對快速變化的業務模型 o2o...
數個大資料O2O網域名稱專場 歡迎拿走
數個大資料o2o網域名稱專場 歡迎拿走 進入專場 cosmosbigdata.com 微軟大資料cosmos 一口價 300元 sparkbigdata.cn spark大資料,最牛比的大資料技術 一口價 300元 hadoopbigdata.cn hadoop大資料,最牛比的大資料技術 一口價 3...
對傳統企業 實現O2O的核心就是大資料
文章講的是對傳統企業 實現o2o的核心就是大資料,目前,網媒及各種論壇充斥著各種o2o的流派聲音 解決方案和案例分析。各類專家樂此不疲地追蹤幾大網際網路豪門的技術動態和市場動向,期望從各類紛繁複雜的企業 試錯 中,找到o2o成功發展的關鍵要素。在混亂的時期,各家企業的利益和戰略意圖摻雜在本身就很複雜...