用資料講故事 七種不同的資料展示方法

2022-06-23 08:42:14 字數 2800 閱讀 8394

什麼使乙個故事真正成為資料驅動呢?在某種程度上,數字不再僅僅是出現在側欄的**,而是能夠在真正意義上促進故事的發展。

資料可以幫助我們用不同視角敘述不同型別的故事。我在tableau public的同事ben jones鼓勵我用七種不同的型別來構造資料故事((à la christopher booker的七個基本的故事情節)。jones這個想法是根據大量資料故事的分析得出的,也可以幫助人們了解一些其他東西,使資料不再受限於側欄**。 這些分類旨在讓資料成為乙個思想啟動器而非我們看到的簡單直白的結果,這樣無疑提高了資料的用處。

我們通過由freedom house(乙個獨立的監測機構)整理的資料來**一下每一種分類。這些資料將每個國家按照「自由」,「部分自由」以及「不自由」進行排名。使用這個簡單 的資料組,我們可以講出七個不同的故事。角度則取決於你想通過這些資料表現什麼以及你將如何展現這些資料。

1. 敘述方式隨著時間改變

對比2023年,有多少國家在2023年被劃分為「自由」呢?事實證明隨著時間變化,這個數字在急劇下降。我們可以通過資料將這種變化變得視覺化,然後再解釋導致變化的原因。

美國全國廣播公司財經頻道的john schoen使用這種方法將dow 30公司過去87年的歷史視覺化。使用者可以點選每十年看到資料是如何在每一次科技**、70年代的通貨膨脹、甚至是經濟大蕭條時發生變化的。美國全國廣 播公司財經頻道的員工基於過去的趨勢將這種視覺化與未來的**結合。

2. 由大及小

下面的這個例子展示了世界範圍內疫苗預防疾病爆發的資料。這個概觀展現了有多少例這種事例存在。讀者可以通過選擇國家、疾病或者年份深入閱讀。讀者可能會被引導看到一些其它相關的鏈結,比如,相比其他國家百日咳在美國更加盛行,並且文中會列出其原因。

3. 由小及大

我們也可以逆推,這種由小視角擴充套件到大視角。例如,首先關注的是世界上最自由的三個國家(這三個國家可能都位於歐洲)。從這裡開始,由小及大來展示歐洲其他國家的排序,然後再次擴大到展示全球的對比,接著讀者就可以看到全世界只有超過三分之一的國家是「自由的」。

4.突出對比

在資料集裡突出不同可以引出乙個有力的敘述。最自由的十個國家都在歐洲,並且恰好距離都非常近。而最不自由的是個國家,相反的,在五個不同的地區。

當然,地域只是「自由」和「不自由」眾多不同之處中的乙個。我們的故事可以繼續**這兩個團體主要的不同方面,從國家政策到文化再到歷史。乙個關於差異的研究是很吸引人的。

下面我們來說乙個相似的故事。它基於人類發展的三維圖(健康長壽的生活,知識和較高的生活水平)比較了世界上所有國家的性別差距。這個圖表的一端的國家都差距較大,而另一端的卻基本平等。

5.**交叉點

當相交的資料中有兩條不同的線,並且乙個超過另乙個時,問題就產生了。這個有關自由的資料顯示出「部分自由」國家的數量超過了「不自由」的國家,繼而超過了「自由」的國家。是什麼導致了這種變化?當排名發生變化時,人們就想知道原因。

自從破窗政策在2023年起作用之後,紐約時報的sarah ryley將紐約發行傳票的數量視覺化。起初它的數量急劇上公升,並且在開始緩慢下降之前一直保持平穩。然後盤查數量的飆公升導致了它在2023年與傳票數量 的乙個交叉點。就算這樣,這兩條線也沒有進行比較。然而,這個交叉點和它的組成部分可以書寫乙個有關紐約執法策略的故事。

6.剖析原因

有時候一些原因集中到一起就像是乙個迷,形成了乙個大局。它們可能是加法或乘法的關係。比如,每個國家的自由程度得分都是法律、經濟和政治自由的總和。

這裡有乙個圖表體現了太陽是怎樣控制天氣的。這個視覺化繪製了從太陽黑子到全球天氣的一些點,強調了它們之間的因果關係。

7.描繪出異常值

我們被那些不同於其他的事物所吸引。我們想要知道這些異常值背後隱藏的原因和原理。

發現這些異常值有時是需要一些資料研究的。將這些有關自由的資料視覺化為分散點圖,你可能會說這裡邊沒有異常值。但是將它們根據區域分解成盒圖,你就可以發現它們是分離的。

這個圖體現了在2023年上半年各**對facebook的需求數量。它清楚的顯示了美國以8200多的需求數量優勢成為了乙個明顯的異常值。 乙個伴隨而來的故事可以點明美國**在社會**監測上的立場,主要是用事例和可能的原因來解釋美國聯邦調查局不同尋常的高數量的需求。

其他的故事型別?

資料探勘的七種常用的方法

利用資料探勘進行資料分析常用的方法主要有分類 回歸分析 聚類 關聯規則 特徵 變化和偏差分析 web頁挖掘等,它們分別從不同的角度對資料進行挖掘。分類。分類是找出資料庫中一組資料物件的共同特點並按照分類模式將其劃分為不同的類,其目的是通過分類模型,將資料庫中的資料項對映到某個給定的類別。它可以應用到...

七種JS資料型別 Symbol

七種js資料型別 六種基本型別 string number boolean null undefined symbol es6新增 一種引用資料型別 boject array function 1 symbol函式前不能使用new關鍵字,否則會報錯,這是因為symbol是原始資料型別,而不是物件,所...

redis的七種資料結構

it168 技術 長生劍 孔雀翎 碧玉刀 多情環 離別鉤 霸王槍 拳頭是古龍筆下的七種 而本文打算將redis的幾種使用方式 strings hashs lists sets sorted sets pub sub transactions 也比作七種 為大家講解redis的七種特性,並列舉其適合的...