視覺化框架設計 整體思路

2022-03-08 18:20:59 字數 1351 閱讀 6682

資料視覺化的本質是:將資料對映到圖形,同時將一些附加資訊傳達給使用者。

乙個視覺化框架需要四部分: 

* 資料處理模組,對資料進行加工的模組,包括一些資料處理方法。例如:合併、分組、排序、過濾、計算統計資訊等 

* 圖形對映模組,將資料對映到圖形視覺通道(後面章節介紹)的過程。例如:將資料對映成顏色、位置、大小等 

* 圖形展示模組,決定使用何種圖形來展示資料,點、線、麵等圖形標記 

* 輔助資訊模組,用於說明視覺通道跟資料的對映關係,例如:座標軸、圖例、輔助文字等

g2實現了上面的四個模組,並且對著四個模組做了更進一步的細分:

這些細分的模組在單獨的章節中各自介紹:

視覺化從資料對映到圖形需要以下流程:

g2的資料對映到圖形的過程整體上遵循這個流程,但是細節上有所增加:

幾個大的流程:

小流程的簡介:

數位化,將分類型別,時間型別的資料轉換成數字,為了可以執行「資料調整」,調整圖形在畫布上的位置

資料調整,為了更清晰的展示資料,圖形有時候需要層疊、分組、散開等,此時需要對資料進行調整

訓練度量度量包含了資料字段的資訊,例如連續欄位的最大值、最小值等資訊,分類字段包含的分類,資料一旦進行調整,那麼度量中的資訊不再準確,所以需要進行度量的訓練

歸一化,將資料的值對映到 0-1空間內,方便資料到視覺通道的對映

計算圖形需要的點,繪製圖形時需要多個點,例如繪製乙個柱狀圖,需要4個點,如果將座標系轉換,仍然是這4個點,僅僅是連線點的方式不同,就會生成不同的圖表

對映,將資料對映到圖形空間的視覺通道

繪製,繪製完成所有的圖形

更詳細的資料流程介紹和示例在後面的各類圖表中分別展示

我們可以看到,在資料進行圖形對映的流程中,資料型別非常重要,不同的資料型別影響不同的對映方式,下一章節我們介紹資料分類和度量

g2 **: 

視覺化框架設計 座標系

前面的章節中我們介紹過了視覺通道,視覺通道中識別度最高,同時支援定性 分類 資料和定量資料的視覺通道是位置 position 各種幾何標記最大的差異就在於資料空間位置的對映,我們將這個空間定義成座標系。常見的座標系 g2中主要實現了直角座標系和極座標系,座標系主要完成了兩個功能 視覺化編碼的兩個核心...

視覺化框架設計 視覺通道

資料視覺化的核心內容是視覺化編碼,是將資料資訊對映成視覺化元素的技術。視覺化編碼由兩部分組成 幾何標記 圖形元素 和視覺通道。人類對視覺通道的識別有兩種基本的感知模式。第一種感知模式得到的資訊是關於物件本身的特徵和位置等,對應視覺通道的定性性質和分類性質 第二種感知模式得到的資訊是物件某一屬性在數值...

視覺化框架設計 資料調整

資料對映到圖形時必須進行視覺編碼,視覺編碼包括幾何標記和視覺通道,幾何標記對應著多種圖表型別,視覺通道定義圖形屬性。視覺通道中最具區分度的通道是位置 position 圖形的位置在一些情況下會出現重疊 所以我們需要對資料進行調整,使得圖形在畫布上不互相重疊。g2中支援以下幾種資料調整 除了解決重疊問...