大資料 挑戰 機會 大資料視覺化面臨哪些挑戰

2021-10-16 11:03:55 字數 1462 閱讀 3048

資料視覺化在大資料場景下面臨諸多新的挑戰,包括資料規模、資料融合、圖表繪製效率、圖表表達能力、系統可擴充套件性、快速構建能力、資料分析與資料互動等。

資料規模

大資料規模大、價值密度降低,受限於螢幕空間,所能顯示的資料量有限。因此為了有效顯示使用者所關注的資料和特徵,需要採用有效的資料壓縮方法。目前已有的方法針對資料本身進行取樣或聚合,未考慮資料視覺化的顯示特性。近期一些學者提出了針對特定視覺化場景的資料壓縮方法。但是目前依然缺少通用的面向視覺化的資料壓縮方法,也缺少實際應用的產品。

資料融合

大資料的另乙個表現是資料型別多樣,常常分布於不同的資料庫。如何融合不同**、不同型別的資料,為使用者提供統一的視覺化視角,支援視覺化的關聯探索與關係挖掘,是乙個重要的問題。其中涉及資料關聯的自動發現、多型別資料視覺化、知識圖譜構建等多個技術問題。

圖表繪製效率

隨著資料規模的增加,圖表視覺化的效率問題越來越凸顯。目前,有些視覺化產品開始採用webgl借助gpu實現平行繪製。越來越多的資料視覺化產品採用b/s架構,其效能一定程度上優先於瀏覽器;另外,由於跨終端需求越來越普遍,也對圖表繪製提出了更多挑戰。

圖表表達能力

隨著產生資料的**增加,資料型別不斷增加,資料使用者對於資料的互動需求越來越多,已有的資料視覺化產品完全無法滿足使用者的視覺化需求,時常出現需要的視覺化形式產品不支援或支援不夠等問題。這就對於系統的圖表表達能力提出了更高的要求,同時對於系統支援使用者的個性化定製提出了新的要求。

系統可擴充套件性

大資料對於資料視覺化系統的擴充套件能力提出了新的挑戰,系統的可擴充套件性將成為衡量乙個大資料視覺化系統的重要指標。

快速構建能力

大資料伴隨著快速變化與增加的資料,如何幫助使用者及時理解資料,發現問題,離不開資料視覺化的快速構建能力,即根據使用者資料驅動的圖表快速定製能力。資料在s級甚至ms級更新的情況下,有沒有可能實現圖表的秒級更新與快速定製。另外,圖表定製後的快速共享與響應功能也將成為必要的系統功能。

資料分析

傳統的bi工具主要集中在資料篩選、聚合及視覺化功能,已經不能滿足大資料分析的需求,gartner提出了「增強分析」,資料視覺化只有結合豐富的大資料分析方法,將資料的探索式分析形成乙個閉環,才能實現完整的大資料視覺化產品,有效幫助使用者理解資料。**性分析是大資料的趨勢,資料視覺化有效結合**方法,將有助於使用者的決策。

資料互動

大資料視覺化使用者需要通過視覺化與圖表背後的資料和處理邏輯進行互動,由此反應使用者的個性化需求,幫助使用者用一種互動迭代的方式理解資料。在傳統的互動手段基礎上,更加自然的互動方式,將有助於使用者與資料更好的互動,也有助於拓展大資料視覺化產品的使用範圍與應用場景。

大資料視覺化面臨哪些挑戰.中琛魔方大資料分析平台表示大資料視覺化技術與產品所面臨主要挑戰的同時也對其發展帶來了新機遇,例如yu等提出的面向資料流式視覺化的自然語言互動介面,通過自然語言與視覺化常見操作的對映實現。

大資料視覺化(四)比例資料視覺化

比例資料根據類別 子類別 群體進行劃分。可以呈現各個部分與其他部分的相對關係,還可以呈現整體的構成情況 不太適合表示精確的資料 適合呈現各部分在整體中的比例,體現部分與整體之間的關係 data pd.read csv data vote result.csv datab data areas of ...

什麼是大資料視覺化

資料視覺化,是關於資料視覺表現形式的科學技術研究。其主要目的是借助圖形手段,清晰 有效地進行傳達與溝通資訊,其中,資料的視覺化表示被定義為一種以某種形式提取的資訊,包括相應資訊單元的各種屬性和變數。資料視覺化技術包含以下幾個基本概念 1.資料空間 資料空間是由n維屬性和m個元素組成的資料集所構成的多...

大資料視覺化(五)關係資料視覺化

關係資料具有關聯性與分布性 兩個量化資料之間的數理關係 通過資料關聯性可已根據乙個已知的數值變化來 另乙個數值的變化。正相關 負相關 不相關 散點圖 crime pd.read csv data crimeratesbystate2005.csv scatter add xaxis crime mu...