如何把資料庫中存在的資料轉變為業務人員需要的資訊?大部分的答案是報表系統。簡單說,報表系統已經可以稱作是bi了,它是bi的低端實現。
現在國外的企業,大部分已經進入了中端bi,叫做資料分析。有一些企業已經開始進入高階bi,叫做資料探勘。而我國的企業,目前大部分還停留在報表階段。
資料包表不可取代
傳統的報表系統技術上已經相當成熟,大家熟悉的excel、水晶報表、reporting service等都已經被廣泛使用。但是,隨著資料的增多,需求的提高,傳統報表系統面臨的挑戰也越來越多。
1. 資料太多,資訊太少
密密麻麻的**堆砌了大量資料,到底有多少業務人員仔細看每乙個資料?到底這些資料代表了什麼資訊、什麼趨勢?級別越高的領導,越需要簡明的資訊。如果我是董事長,我可能只需要一句話:目前我們的情況是好、中還是差?
2. 難以互動分析、了解各種組合
定製好的報表過於死板。例如,我們可以在一張表中列出不同地區、不同產品的銷量,另一張表中列出不同地區、不同年齡段顧客的銷量。但是,這兩張表無法回答諸如「華北地區中青年顧客購買數位相機型別產品的情況」等問題。業務問題經常需要多個角度的互動分析。
3. 難以挖掘出潛在的規則
報表系統列出的往往是表面上的資料資訊,但是海量資料深處潛在含有哪些規則呢?什麼客戶對我們價值最大,產品之間相互關聯的程度如何?越是深層的規則,對於決策支援的價值越大,但是,也越難挖掘出來。
4. 難以追溯歷史,資料形成孤島
業務系統很多,資料存在於不同地方。太舊的資料(例如一年前的資料)往往被業務系統備份出去,導致巨集觀分析、長期歷史分析難度很大。
因此,隨著時代的發展,傳統報表系統已經不能滿足日益增長的業務需求了,企業期待著新的技術。資料分析和資料探勘的時代正在來臨。值得注意的是,資料分析和資料探勘系統的目的是帶給我們更多的決策支援價值,並不是取代資料包表。報表系統依然有其不可取代的優勢,並且將會長期與資料分析、挖掘系統一起並存下去。
八維以上的資料分析
為了達到olap的目的,傳統的關係型資料庫已經不夠了,需要一種新的技術叫做多維資料庫。
多維資料庫的概念並不複雜。舉乙個例子,我們想描述2023年4月份可樂在北部地區銷售額10萬元時,牽扯到幾個角度:時間、產品、地區。這些叫做維度。至於銷售額,叫做度量值。當然,還有成本、利潤等。
如圖2,每個維度分別代表了時間、產品和地區,立方體上的單元代表了度量值。進一步,維度可以分為不同的層次。
圖1 某案例中對銷售額的解析及當前產品的分類
資料分析和資料探勘
什麼是資料分析與資料探勘 資料分析 對已知資料進行分析,然後提取一些有價值的資訊 比如 統計出平均數 標準差等資訊 資料探勘 對大量的資料進行分析挖掘,得到一些未知的,有價值的資訊等。比如從 的使用者或使用者行為資料中挖掘出使用者其潛在需求資訊,從而對 進行改善 已知到未知 關係 資料分析和資料探勘...
資料分析和資料探勘相關模組
numpy 一般使用 numpy mklpandas 資料分析和處理模組,能為複雜情形下的資料提供堅實的基礎分析功能scipy 支援數值計算,支援矩陣運算,提供高等數學處理 積分 傅利葉變換 微分方程求解matplotlib 資料成圖模組,解決資料視覺化statsmodels 注重資料統計建模分析的...
BI 資料倉儲和資料分析之間的區別
bi 商業智慧型 bi與清單上其他兩個智慧型的區別在於呈現的想法。bi主要是關於如何利用從分析中獲得的見解來採取行動。bi工具包括以下專案 1 圖形和圖表 2 書面報告 3 試算表 4 儀表板 5 演示文稿 6 會議分享見解 bi是最終產品 在事物的流動中商業智慧型與資料倉儲和分析系統進行了大量互動...