從昨天開始,00後大軍已經就開始高考了,在網路上對這次高考的報道很多,很多都關注了今年的考生資料,並且用炫酷的圖表展示。看著是不是有點小嫉妒,為什麼圖表還可以做得這麼漂亮???是不是也想自己動手做一張???其實這些圖表都可以用python製作出來的資料視覺化的產物。答案當然是可以的啦
準備工作資料
常見類經常見到或者使用的圖表是柱狀圖和折線圖,所以先從簡單的入手 。
1. 柱狀圖
# 高考人數
gaokao_num = [940,940,...,375]
gaokao_num.reverse()
# 錄取人數
luqu_num = [700,705,...,221]
luqu_num.reverse()
# 錄取率
luqu_lev= [74.46,75,...,59]
luqu_lev.reverse()
import charts
options = ,
#標題'title' : ,
#副標題
'subtitle': ,
#x軸
'xaxis' : ,
#y軸
'yaxis' : },
}series = [,
]charts.plot(series, options=options, show='inline')
由於我的pyecharts
有點小問題,所以用了charts
進行處理,使用pyecharts
更加簡單,這裡就不重複了。
今年有975萬考生,可以看出10-18年這段時間的高考人數是穩點的。但是人口基數大是沒有辦法的事,「千軍萬馬過獨木橋」這句話還真是有點應景哈。。。
2. 折線圖
如果上面的柱狀圖沒有問題的話,那折線圖就非常簡單了,只是將type
由column
修改為line
就行了。
series = [
}]
本來是將柱狀圖和折線圖展示在一張圖裡面的,但是y軸的值太大了,導致錄取率的變化看起來不大,所以這裡就將它們拆開了
地圖類先放上一張高考難度排行榜,想當年我也是從困難模式過來的。真的心疼江蘇的孩子,好像數學又是葛軍出題,看來又要上熱搜了大江蘇(手動滑稽)
現在開始利用pyecharts
製作地圖類圖表,看一下中國哪個省份的高考生最多
from pyecharts import map
#處理資料
add =["北京",...,"**"]
num = [6.3,...,2.53]
dict_data = dict(zip(add,num))
data = [tuple(i) for i in zip(add,num)]
data_pro = data
geo = map("各省高考人數分布", "data from : gaokao.eol.cn", title_color="#fff",
title_pos="center", width=1000,
height=600, background_color='#404a59')
attr, value = geo.cast(data_pro)
geo.add("", attr, value, visual_range=[0, 80],maptype='china',visual_text_color="#fff",
symbol_size=10, is_visualmap=true)
geo.render("各省高考分布.html")#生成html檔案
geo#直接在notebook中顯示
效果圖:
看來河南和廣東的考生壓力有點大呀(!_!)
多說一點
Python 資料視覺化
資料視覺化指的是通過視覺化表示來探索資料,它與資料探勘緊緊相關,而資料探勘指的是使用 來探索資料集的規律和關聯。資料集可以是用一行 就能表示的小型數字列表,也可以是數以吉位元組的資料。漂亮地呈現資料關乎的並非僅僅是漂亮的。以引人注目的簡潔方式呈現資料,讓人能夠明白其含義,發現資料集中原本未意識到的規...
資料視覺化 什麼是資料視覺化
資料對應的英文單詞是data,從資訊獲取的角度看,資料是對目標觀察和記錄的結果,是現實世界中的時間 地點 事件 其他物件或概念的描述。不同學者對資料的作用也給出不同的定義,大致分為以下3類 視覺化對應的兩個英文單詞 visualize和visualization。visualize是動詞,描述 生成...
Python資料視覺化總結
用python完成資料分析後,如何把結果呈現出來,比如畫乙個吸引人注意的圖表相當重要。當你探索乙個資料集,需要畫圖表,圖表看起來令人愉悅是件很高興的事。在給你的觀眾交流觀點,給領導匯報工作時,視覺化同樣重要,同時,也很有必要去讓圖表吸引注意力和印入腦海裡。在python中numpy,pandas,m...