資料視覺化概述

2022-02-19 19:49:01 字數 1211 閱讀 8224

乙個優秀的統計圖形應該是清晰、精確高效的,其應做到以下幾點:

1、呈現資料;

2、引導觀察者去思考你要傳達的主旨資訊,而非去想圖形是怎麼設計的、用什麼工具繪製的這類問題;

3、不扭曲資料的真實資訊;

4、在有限的空間傳達盡可能多的你想傳達的資訊;

5、針對大資料集,也能保證圖示是清晰的、一目了然;

6、不同元素間的對比明顯,可以抓住觀察者的眼球;

7、從概況、細節等不同層面揭示資料隱含的資訊;

8、服務於某一特定目標,如說明某乙個問題或探索資料的隱含資訊;

9、與對資料集的描述緊密結合。

如果運用得當,圖表比傳統的統計計算更能說明問題,最經典的例子就是安斯庫姆四重奏。2023年,統計學家f.j. anscombe構造了四組奇特的資料,以告訴人們在分析資料之前,對其進行視覺化展示是多麼重要。

(安斯庫姆四重奏:f.j. anscombe構造的這四組x值的平均數都是9.0,y值的平均數都是7.5;x值的方差都是10.0,y值的方差都是3.75;相關度都是0.816,線性回歸均為y=3+0.5x,單從這些統計資料來看,四組資料反映出的實際情況非常相似,但事實上,這四組資料有這巨大的差異。)

圖1  四重奏資料集

儘管各種統計資料顯示這四組資料是多麼一致,但是透過下面的視覺化圖表,差異一目了然。

圖2  四重奏資料集對應圖形

圖形化展示也會得到與上述相反的效果,如下圖中,我們很容易將目光鎖定在a點,這個看似隨意的點將對整個資料集的統計結果產生決定性影響,但需要注意的是:雖然在二維散點圖中a看似是乙個異常點,但在邊緣分布(只關注x軸或y軸)中,a點和其它點並無明顯差異。

圖3  有異議的a點

雖然資料視覺化有利有弊,但無論怎樣,錯誤的理論只會產出錯誤的圖形。統計圖形與統計計算有一點是相同的,即都取決於輸入的資料的質量,再高大上的統計圖形也拯救不了錯誤的操作、荒謬的模型或微小的資料集。

done。從下節開始講述如何使用圖形就行高效的溝通。

資料視覺化 什麼是資料視覺化

資料對應的英文單詞是data,從資訊獲取的角度看,資料是對目標觀察和記錄的結果,是現實世界中的時間 地點 事件 其他物件或概念的描述。不同學者對資料的作用也給出不同的定義,大致分為以下3類 視覺化對應的兩個英文單詞 visualize和visualization。visualize是動詞,描述 生成...

資料視覺化及Tableau概述 1

現如今資料的指數倍增長 資料型別繁多 資料價值密度低 因為數字太抽象,圖表更直觀 視覺化的形式有助於降低讀懂資料的門檻 資料視覺化主要旨在借助於圖形化手段,清晰有效地傳達與溝通資訊 直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的資料集的深入洞悉 讓使用者快速掌握資訊的關鍵點,幫助他們做出...

資料視覺化

資料視覺化主要旨在借助於圖形化手段,清晰有效地傳達與溝通資訊。但是,這並不就意味著資料視覺化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端複雜。為了有效地傳達思想概念,美學形式與功能需要齊頭並進,通過直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的 資料集...