1.倉庫建設原則
(1)自上而下+自下而上。
(2)高容錯性
(3)資料質量監控貫穿整個資料流程
(3)不怕資料冗餘,利用儲存換易用
總體思路-》模型設計-》資料架構=》資料治理
維度建模or實體關係建模
減少層次結構的目的是為了壓縮整體資料處理流程的長度,扁平化的資料處理流程有助於資料質量控制和資料運維。
當前的資料應用方向會起來越關注資料的時效性,越實時的資料越有價值。
需求驅動。
結構化資料採集:
(1)全量採集(2)增量採集(3)實時採集
非結構資料特徵提取:
資料服務化:
(1)統計服務(2)分析服務(3)標籤服務
實用的點:
(1)巧用虛擬節點(2)強制分割槽(3)計算框架應用(4)優化關鍵路徑
資料不再是乙個邊緣性的東西,資料的質量越來越重要。
合理的資料生命週期要保證溫熱資料佔整個資料體系大部分。
企業大資料平台倉庫架構建設思路
實習過後需要學習一下才更有體會 問題 資料 式地增長,各種結構化 半結構化 非結構化資料的產生,越來越多的企業開始在大資料平台下進行資料處理。結構簡單,便於事實資料分析,適合業務分析報表和bi 結構較複雜,但它便於主體資料打通,適合複雜資料內容的深度挖掘。每個企業在構建自己數倉時,應該根據業務形態和...
金融行業資料倉儲的建設思路
金融機構建設資料倉儲並非一朝一夕之事,需要投入巨大的人力物力,是整個公司戰略級的專案,本文只是結合自己的行業知識,整理下大概的建設思路。從上面概念中,大概可以知道資料倉儲是用於上層分析性報告和決策支援的基石,也就是現在流行的資料中颱中重要的組成部分。所以搭建好資料倉儲,是整個資料中臺建設的重中之重。...
江西加快智慧型防汛建設 構建防汛大資料平台
智慧型防汛是在水利資訊化的基礎上高度整合防汛資訊資源並加以開發利用,通過物聯網技術,無線寬頻,雲計算等新興技術與防汛資訊系統的結合,實現防汛資訊共享和智慧型管理,有效提公升防洪工程運用和管理的效率和效能,有效提公升防汛減災救災能力和水平。該省撫州市已建立 水利監控 平台。2013年5月,該市防汛指揮...