在設計視覺化圖表時,你需要刪掉資料中的所有無關內容。edward tufte 將所有的無關內容稱為圖表垃圾。
例如,下面這個圖表展示的是宇宙飛船火箭助推器的 o 形環損壞。在挑戰者號**之後的調查中就出現了這張圖。當時的調查確定宇宙飛船**是因為在發射過程中,天氣很冷,o 形環出現故障。(o 形環是用來對兩個物體之間的空隙進行密封的橡膠環)
火箭助推器中的 o 形環損壞。
該圖表中的資訊太多,實際上很難從中得出任何資訊。火箭是經典的圖表垃圾,視覺元素沒有表示資料,而是引起干擾。我清理了上圖中的資料:
我的挑戰者號 o 形環資料版本
根據之前的資料,你立即就能看出挑戰者號飛船上的 o 形環幾乎肯定會在這一外部溫度出現故障。
你有時候還會看到具有圖案、3d 效果、密度網格等的圖表。所有這些都會影響讀者對資料的理解。
tufte 的「visual display」中的經典圖表垃圾示例
壞的蘋果派(沒錯,這個雙關笑話是我想出來的)。
這個餅圖存在 3d 效果,頂部向後傾斜。雖然紫色部分標為 21.2%,但是肉眼看去,比綠色 19.5% 部分要小。它們建立了乙個本身就很難看明白的餅圖,並且變得更糟糕。
即使沒有圖表垃圾,很多圖表也會將很多視覺空間留給非資料元素。tufte 使用墨水一詞來指代圖表中的任何視覺元素。表示資料的視覺元素是資料墨水,其他所有元素是非資料墨水。作為設計師,我們應該儘量減少非資料墨水的量,從而刪除資料中的干擾項。
檢視正常的柱狀圖。
表示三種鳶尾花物種的平均測量結果的典型柱狀圖。
上圖是乙個典型的柱狀圖。上面存在可以刪掉的非資料墨水。例如,圖表周圍的方框是不表示任何資料的墨水。
同一柱狀圖,只是沒有惱人的方框了。
縱軸沒必要存在,除了刻度線之外,所以也可以刪了。
沒有縱軸的柱狀圖。
最後,我可以新增白色網格,幫助讀者正確地看出長條高度。
用白色網格表示縱軸刻度的柱狀圖。
通過對比原圖和最終版本,可以看出我刪除了很多非資料墨水。圖表的重心是資料,應該儘量減少干擾性視覺元素。
現在,我們看看可以從另一種常見圖表「箱線圖」中刪除哪些元素。
對於上述箱線圖,圖中有很多不表示任何資料的墨水。該箱線圖中的哪些元素應該刪掉?
水平結束端點
中心方框
異常值標記
正中線提交
這是刪掉所有不必要的標記(例如方框和水平結束端點)之後的箱線圖。展示的是同一資料,但是線條少多了。原始圖表有 9 個垂直線條和 15 個水平線條。我將其縮減成了 6 個垂直線條和 3 個點。
同一資料,但是墨水更少。
希望你已經明白少即是多。我們應該始終嘗試縮減視覺化圖表,使讀者更容易理解。
接著,我將介紹如何設計視覺化圖表,避免錯誤地表示資料。
Python視覺化學習筆記二
coding utf 8 from matplotlib.pyplot import import matplotlib.pyplot as plt def for example plot儲存資料集,多組資料展現多條線 plot 1,2,3,2,3,2,2,1 plot 4,3,2,1 1,2,3...
資料視覺化學習筆記(二)
視覺感知 1.視覺感知和視覺認知 視覺認知 格式塔 gestalt 原則 基本原則 格式塔原則描述了人在視覺上如何感知物件,是圖形和使用者介面設計的基本準則。簡單提煉法則 格式塔原則最基本的法則是簡單提煉法則。視覺感知 將視覺感知內容理解為常規的 簡單的 相連的 對稱的或有序的結構。整體 將事物理解...
R視覺化學習筆記1 資料匯入
import data 匯入csv資料,header t則首行有列名,heater false 則首行無列名 x read.table d desktop sj.csv sep header t gdp x gdp g1 x g1 g2 x g2 g3 x g3 若無行名,進行行名定義 data r...