資料分析思維培養系列4 資料視覺化篇

2022-08-23 07:21:12 字數 2660 閱讀 2738

本文章為spssau資料分析思維培養的第4期文章。

前3期內容分別講述資料思維,分析方法和分析思路。本文講述如何快速使用spssau進行高質量作圖,以及如何選擇使用正確的圖形。

本文分別從五個角度進行闡述,首先是spssau自動出圖角度,spssau作圖思路角度(x和y的角度),視覺化圖如何正確使用,以及一部分特殊統計圖如何處理和spssau圖形樣式調整等。

spssau總是會預設提供最適合的圖,當然也可選擇使用。為什麼spssau可以做到這樣,原因在於做分析的時候已經帶著資料的型別,因此spssau預設就知道應該畫出什麼樣的圖形。

比如做交叉分析,在得到規範**時,spssau缺省會生成對應的柱形圖,條形圖,堆積柱形圖或堆積條形圖等,spssau預設提供的圖通常都是最優的,如果你希望切換成其它型別,點一下就好。

或者在進行方差分析時,需要對比不同類別資料的平均值差異,那麼此時使用折線圖是最優選擇,因此spssau會預設提供折線圖,如下:

spssau視覺化結合了資料分析方法的思想,預設提供準確的視覺化圖形展示,這是spssau智慧型系統的乙個組成部分,如果自己有特徵的偏好,想按照自己的想法畫圖,接下來第二部分講述如何按照自己的思路進行畫圖。

按照x和y的思維,先識別出x和y分別的資料型別情況,直接使用即可。spssau當前提供累計共30類圖形,分布於各個方法中自動生成,當然還有一些複雜或者特殊的圖形需要自己作圖。

比如多維的柱形圖、多維的條形圖或者多維的折線圖,多維的箱線圖,多維的誤差線圖等。均可在spssau視覺化裡面找到,如下圖:

假如現在想分析不同性別,且不同婚姻狀況的人,他們在職業認同上的差異性,希望通過圖形視覺化展示差異情況;明顯的這裡面有2個x,而且都是定類資料;職業認同是定量資料,因此可使用『簇狀圖』進行,如下圖:

簇狀折線圖

簇狀柱狀圖

箱線圖

誤差線圖

前述兩部分已經講述在spssau上如何進行作圖,非常簡單易懂,本部分講述如何進行的使用圖形,即圖形如何進行講解。首先在選擇了正確的圖形基礎上舉例說明,通常情況下,我們都希望圖形呈現出有價值的資訊,比如資料是否有明顯的差異性,也或者資料之間是否有著明顯的相關關係,也或者檢視資料的分布是否有著正態性等。

依舊以資料型別為例,如果為定類資料,那麼資料的選擇百分比是否為100%,如果為100%,那麼可能使用餅圖,或者柱子一樣高的堆積柱形(或條形)較為適合,因為需要特別呈現出比例加和為100%的效果;如果說資料為定量,那麼通常情況下是檢視平均值的大小直接進行對比,折線的高度更高那麼說明平均值越大。當然也有可能使用其它的指標,比如中位數等進行表達,但都沒有關係,選擇了正確的視覺化圖後直接描述即可,並無複雜可言。

需要特別說明的一點是spssau在視覺化裡面提供了萬能的『簇狀圖』,此處spssau進行了智慧型化處理,無論你放入什麼樣的資料,spssau總是會幫你生成對應的圖形,而不用各個地方到底進行處理。

spssau『簇狀圖』裡面,不論x的個數為0個,1個,也或者2個,都可以得到對應的圖形,乙個按鈕,智慧型提供了各類圖形的全部生成。並且在得到圖形後,也可以手工設定自己希望的指標,比如想統計不同性別群體,他們銷售額的平均值,也或者銷售總和(求和),也或者銷售筆數(計數)等,均可點一下就切換實現圖形自動變化。

圖形視覺化在統計裡面使用較多,如箱線圖可檢視資料是否有異常值,或對比資料的差異性;誤差線圖檢視資料的波動幅度及差異情況;pp/qq圖檢視資料的正態性情況;帕累托托分析『二八原則』找到問題原因,也可以使用散點圖了解資料之間的關係情況等,在spssau『視覺化』裡面均可全部實現,作圖效果如下:

散點圖帕累託圖

象限圖散點圖上述已經講解spssau的各類視覺化圖形,接著講解下spssau視覺化圖的樣式設定等,通常情況下再作圖後,比如想切換下樣式風格,也或者小數字,也或者不想顯示座標軸等,均可在spssau生成的視覺化下面進行設定,如下圖:

spssau當前提供字型、字型大小、小數字、是否隱藏標籤、是否展示y軸,以及四類色彩風格設定,該設定只需要在任何乙個地方設定,後續和其它全部的圖都會基於該設定生成『視覺化圖』,不需要重複進行設定。

學術風格

專業風格

資料分析思維

使用者統計維度 性別 年齡.使用者行為維度 註冊使用者 使用者偏好 使用者興趣 使用者流失.消費維度 消費金額 消費頻率 消費水平.商品維度 商品品類 商品品牌 商品屬性.如 表面上女生的錄取率明顯高於男生,實際上男生的錄取率高於女生。j解決方法 很多時候資料分析是沒有資料可明確參考的 比如新進入學...

資料分析思維

做資料分析,首先你得具備看待乙個事物的邏輯化思維,其次用資料去證明他。一 結構化思維 金字塔結構 1 列出所有思考的要點 2 找出關係,進行分類 二 指標化思維 分析思維幫助定性問題,介入資料定量分析需要指標化思維 用指標去衡量和說明問題,如pv 頁面瀏覽量 uv 獨立訪客數 指標 各行業指標體系 ...

動手學資料分析 4 資料視覺化

2.2 繪製圖形 2.3 繪圖流程 2.4 自定義影象 2.5 儲存影象 2.6 顯示影象 引言 複習 思考 最基本的視覺化圖案有哪些?分別適用於那些場景?1.柱狀圖 可用於展示多個分類的資料變化和同類別各變數之間的比較情況。尤其適用於對比分類資料 2.條形圖 類似軸對調的柱狀圖,尤其適用於類別名稱...