對大資料進行互動式分析

2021-09-04 11:57:16 字數 596 閱讀 6970

之前提到過,大資料分析(bda)包括大資料的採集、儲存、分析、展示。而其中分析是bda的關鍵。說到分析,可以分為歷史分析和實時分析。對於歷史分析,對典型的就是利用map-reduce技術進行資料查詢、統計;而對於實時分析,最重要的就是實時計算/持續計算技術,我以前也提到過,包括流資料處理、cep等等。

其實,對於歷史分析,除了上面提及的基於map-reduce或者批處理技術的查詢統計分析外,還有一類很重要的分析,可以叫做互動式分析,形如傳統bi領域的一種分析,強調快速的資料分析,典型的應用就是資料鑽取。例如,在bi中,可以對於資料進行切片和多粒度的聚合,從而通過多維分析技術實現資料的鑽取。

針對tb級的大資料,如何進行鑽取和互動式分析?這自然不容易,apache近期正在孵化乙個這樣的專案,叫做drill。這個專案是受到了google的dremel而產生的。這兩個專案分析的大資料物件就是基於hadoop的。

互動式分析可以作為基於map-reduce技術的批處理分析的良好補充。在siem/安全管理平台系統中,這種互動式分析的use case還是很多的。一般的做法本質上其實跟drill等也都差不多,就是去構建執行引擎,或者說去建構一些資料切片,並能夠快速地串起來。當然,好的演算法能夠提公升執行引擎的效率,這個就看各家的水平了。

Python資料互動式視覺化 互動式視覺化

雖然靜態資料視覺化是向提取和解釋資料集所擁有的價值和資訊這一目標邁出的巨大飛躍,但互動性的增加使這些視覺化向前邁了一大步。互動式資料視覺化具有以下特點 讓我們從乙個示例開始,了解通過互動式視覺化可以實現的目標。讓我們考慮乙個註冊健身房會員的資料集 圖略以下是箱形圖形式的靜態資料視覺化,它描述了按性別...

echo e對互動式腳步傳入引數

ehco命令的 e選項 啟用轉義字元。使用 e選項時,若字串 現以下字元,則特別加以處理,而不會將它當成一般文字輸出 a 發出警告聲 b 刪除前乙個字元 c 最後不加上換行符號 f 換行但游標仍舊停留在原來的位置 n 換行且游標移至行首 r 游標移至行首,但不換行 t 插入tab v 與 f相同 插...

對大資料進行實時分析

大資料分析 bda 包括大資料的採集 儲存 分析 展示。而其中分析是bda的關鍵。說到分析,可以分為歷史分析和實時分析。上次我們著重提過了歷史分析,尤其是互動式歷史分析,當然還有批處理式的歷史分析。這次,我們回過頭來再談談實時分析,包括流處理 cep,等等。說到cep,複雜事件處理 complex ...