資料視覺化的本質是:將資料對映到圖形,同時將一些附加資訊傳達給使用者。
乙個視覺化框架需要四部分:
* 資料處理模組,對資料進行加工的模組,包括一些資料處理方法。例如:合併、分組、排序、過濾、計算統計資訊等
* 圖形對映模組,將資料對映到圖形視覺通道(後面章節介紹)的過程。例如:將資料對映成顏色、位置、大小等
* 圖形展示模組,決定使用何種圖形來展示資料,點、線、麵等圖形標記
* 輔助資訊模組,用於說明視覺通道跟資料的對映關係,例如:座標軸、圖例、輔助文字等
g2實現了上面的四個模組,並且對著四個模組做了更進一步的細分:
這些細分的模組在單獨的章節中各自介紹:
視覺化從資料對映到圖形需要以下流程:
g2的資料對映到圖形的過程整體上遵循這個流程,但是細節上有所增加:
幾個大的流程:
小流程的簡介:
數位化,將分類型別,時間型別的資料轉換成數字,為了可以執行「資料調整」,調整圖形在畫布上的位置
資料調整,為了更清晰的展示資料,圖形有時候需要層疊、分組、散開等,此時需要對資料進行調整
訓練度量度量包含了資料字段的資訊,例如連續欄位的最大值、最小值等資訊,分類字段包含的分類,資料一旦進行調整,那麼度量中的資訊不再準確,所以需要進行度量的訓練
歸一化,將資料的值對映到 0-1空間內,方便資料到視覺通道的對映
計算圖形需要的點,繪製圖形時需要多個點,例如繪製乙個柱狀圖,需要4個點,如果將座標系轉換,仍然是這4個點,僅僅是連線點的方式不同,就會生成不同的圖表
對映,將資料對映到圖形空間的視覺通道
繪製,繪製完成所有的圖形
更詳細的資料流程介紹和示例在後面的各類圖表中分別展示
我們可以看到,在資料進行圖形對映的流程中,資料型別非常重要,不同的資料型別影響不同的對映方式,下一章節我們介紹資料分類和度量
g2 **:
視覺化框架設計 座標系
前面的章節中我們介紹過了視覺通道,視覺通道中識別度最高,同時支援定性 分類 資料和定量資料的視覺通道是位置 position 各種幾何標記最大的差異就在於資料空間位置的對映,我們將這個空間定義成座標系。常見的座標系 g2中主要實現了直角座標系和極座標系,座標系主要完成了兩個功能 視覺化編碼的兩個核心...
視覺化框架設計 視覺通道
資料視覺化的核心內容是視覺化編碼,是將資料資訊對映成視覺化元素的技術。視覺化編碼由兩部分組成 幾何標記 圖形元素 和視覺通道。人類對視覺通道的識別有兩種基本的感知模式。第一種感知模式得到的資訊是關於物件本身的特徵和位置等,對應視覺通道的定性性質和分類性質 第二種感知模式得到的資訊是物件某一屬性在數值...
視覺化框架設計 資料調整
資料對映到圖形時必須進行視覺編碼,視覺編碼包括幾何標記和視覺通道,幾何標記對應著多種圖表型別,視覺通道定義圖形屬性。視覺通道中最具區分度的通道是位置 position 圖形的位置在一些情況下會出現重疊 所以我們需要對資料進行調整,使得圖形在畫布上不互相重疊。g2中支援以下幾種資料調整 除了解決重疊問...