1.有了生產庫, 通過cdc捕獲資料變化, 通過ssis 將資料儲存到資料倉儲裡面, 現在要做的就是建立多維資料集ssas進行資料統計分析.
2.本地環境搭建好多維資料集之後, 如何發布到正式環境呢? 總不該說在正式伺服器上也裝乙個 vs吧.
經過研究發現, 可以使用xmla 查詢 來完成.
首先在測試環境上,搭建多維資料集, 然後通過 如下的這種方式, 可以生成 xmla 指令碼, 這個是 xmla查詢,
需要將xmla檔案的 資料來源的資料庫連線改一下, 這個就是 抽取資料的**.
部署到正式環境上,有乙個地方要注意下, 那就是 多維資料集的分割槽設定 .
同樣右鍵生成xmla檔案到新視窗, 可以看到 分割槽規則( 同乙個資料來源分割槽, 用的是 查詢繫結, 主要檢視 where 條件的界限值)
如果要建立新的分割槽, 只需要 將xmla檔案的 分割槽的id 和 name 修改一下, 然後下面的 sql語句建立好對應的查詢規則, 就可以設定新的分割槽了.
設定分割槽的目的是為了將各個時間段的資料分開, 比如 生產資料 1-3月份的資料,到了4月份的時候,之前的歷史資料可能有的已經發生了更改 ,
統計報表到4月份再來校驗 第一季度1到3月份資料的時候,就會發現有對不上的情況. 所以我們將每個月, 分開單獨建立乙個分割槽進行統計, 統計1-3月份的資料,
就只將1,2,3 3個月的分割槽的資料合併在一起, 而不是到資料倉儲區去 直接查 where month in (1,2,3) .
另外,有時會新增欄位或刪除字段, 多維資料集cube 結構改變了, 建立的分割槽啊什麼的,可能都會受影響.所以及時做好 cube 備份也是必須的.
同樣的, 資料庫右鍵備份, 然後可以看到 在 "幫助" 旁邊有乙個 "指令碼" , 通過這個可以看到該操作的指令碼,沒錯,又是 xmla ,這裡要說一下, 下面的設定密碼儲存
先去掉.
備份的指令碼如下
jgbolapdbsln
jgbolapdbsln.abf
其中 databaseid 是當前要備份的資料庫, 裡面存放的是備份的檔案, 後罪名是 .abf檔案
多維資料集這邊所要處理的問題大概就這些了. 加欄位,刪字段什麼的,這個暫時還沒研究. xmla 語法比較特殊,
以及後續的 mdx 查詢語句, 跟普通的 sql查詢 不是一回事.
資料倉儲構建步驟
構建企業級資料倉儲五步法 一 確定主題 即確定資料分析或前端展現的主題 例 某年某月某地區的啤酒銷售情況 主題要體現出某一方面的各分析角度 維度 和統計數值型資料 量度 之間的關係,確定主題時要綜合考慮.二 確定量度kpi 確定主題後,需要考慮分析的技術指標 例 年銷售額等等 它們一般為資料值型資料...
基於 Hive 構建資料倉儲
設想有一批各種型別的離線 或實時 資料 文字 csv excel 等 我們如何挖掘這些資料背後的價值,分析這些資料之間的關聯?很容易想到的就是,寫程式把每種資料按照某種規則抽取出來放到關係型資料庫中進行分析。這樣做可能存在什麼樣的問題?按照某種規則進行抽取,是否會導致原始資料資訊的丟失?因為前期設計...
資料倉儲 資料倉儲部署
1 首先用下面的語句查詢是否有要建立的表空間 hospdw tab 和 hospdw idx 如果沒有,則把d database zyhip改為對應的路徑,有的話直接建立使用者 select tablespace name,file name,round bytes 1024 1024 0 size...