1 設計表的時候,需要考慮到儲存能量和資料沉澱,減少計算。比如說,計算近3個月的指標,可以通過上一次的近3個月數、上一日的數和當前日的數想計算得出,而不需要對三個月的數做sum操作。
當日的近3月累計數 = 上日的近3月累計數 + 當日的近1日的增量數 - 上日的近1日的增量數
以此類推,近3日、近7日、近一月等等都可以通過這個方式計算,這樣節省大量計算資源。
2 關於如何構建資料倉儲的構想
資料倉儲如社會,存在多種多樣的生態;表如人,存在多種角色,你可能是某人的男友,某人的兒子,某人的學生。表也是如此,存在多種維度。
現在問題來了,如何構建資料倉儲能支援當今快速發展的業務,滿足各式各樣的需求。我的思考,當今社會也在快速發展,每天產生不同的組織和生態,那麼人是如何適應並生存的呢?
通過我的觀察,發現乙個能快速適應當今社會的人,都具備有哪些特點呢?
首先,他具有一專多精的特點,能會和他對接的組織。一專是他立身的資本,多精是指他對其他領域做過研究,有比較深的理解。當他和其他領域的人去做鏈結的時候,可以聊得上理解對方的想法,並可以產生化學反應。
其次,會混圈子。現在最頂級的人才,其實大家都互相認識或通過朋友能鏈結的上。也就是說,他們其實都是乙個圈子的人。平時,沒什麼事,開個討論會啊,聊聊專業領域啊,聊聊未來發展趨勢啊,或者就聊聊人生等雜七雜八的。這也是,現在為何有這麼多論壇的出現。
如果你像創業,想尋找合夥人或專業人才,基於以上兩點就能很快定位。雷軍建立小公尺的尋找合夥人也是通過這種方式尋找的。
那麼,在乙個龐大複雜的資料倉儲中,我們如何快速尋找資料呢?
我有三點看法:
1 屬性,給表配置豐富的屬性。就向給人打標籤一樣。
2 組織,這個和維表很像,但是這個需要描述清楚與那張表關聯起來。就像人一樣,你進某個組織都需要登記在冊的。
3 公共層,有一些關聯緊密的資料,經常會做關聯查詢的,我們把它們加工成公共表。
資料倉儲 資料倉儲部署
1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...
資料倉儲,什麼是資料倉儲?
資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。資料倉儲是為企業所有級別的決策制定過程提供支援的所有型別資料的戰略集合。它是單個資料儲存,出於分析性報告和決策支援的目的而建立。為企業提供需要業務智慧型來指導業務流程改進和監視時間 成本 質量和控制。資料倉儲是決策支援系統 ds...
資料倉儲和資料倉儲分層
資料倉儲 data warehouse 可簡寫為dw或dwh。資料倉儲,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合。它是單個資料儲存,出於分析性報告和決策支援目的而建立。為需要業務智慧型的企業,提供指導業務流程改進 監視時間 成本 質量以及控制。1 問題簡單化,將乙個複雜的問題分...