大資料視覺化案例一 詞云

2022-05-08 07:12:10 字數 1521 閱讀 7119

詞云:

詞雲圖過濾掉大量的文字資訊,使瀏覽網頁者只要一眼掃過文字就可以領略文字的主旨。

在之前通過爬蟲獲得新冠肺炎資料之後,使用詞云來直觀反映哪些地區的疫情較嚴重。(字越大反映越嚴重)

第一步:讀取excel資料

import openpyxl

wb = openpyxl.load_workbook('data.xlsx')

第二步:過濾資料並且獲得國內疫情資料的地點與確診人數資料

ws = wb['國內疫情']

frequency_in = {}

for row in ws.values:

if row[0] == '省份':

pass

else:

frequency_in[row[0]] = float(row[1])

第三步:詞云

from wordcloud import wordcloud

#中文隸書

wordcloud = wordcloud(font_path='c:/windows/fonts/simli.ttf',

background_color="white",

width=1920,height=1080)

其中使用c:/windows/fonts/simli.ttf表示中文隸書的表示方式,也可以使用其他的表示方式。

第四步:構建詞云

#資料確診病例生成詞云

wordcloud.generate_from_frequencies(frequency_in)

#儲存詞云

wordcloud.to_file('wordcloud_in.png')

國內疫情詞云結果:

接下來繪製國外的詞云:

首先從不同的sheet裡獲取資料:

frequency_out = {}

sheet_name = wb.sheetnames

for each in sheet_name:

if "洲" in each:

ws = wb[each]

for row in ws.values:

if row[0] == '國家':

pass

else:

frequency_out[row[0]] = float(row[1])

接下來繪製詞云:

#資料確診病例生成詞云

wordcloud.generate_from_frequencies(frequency_out)

#儲存詞云

wordcloud.to_file('wordcloud_out.png')

結果展示:

python 資料視覺化 詞云

近年來,大資料等一系列字眼開始進入到普通老百姓的生活中,但大部分老百姓對其知之甚少。人們通常了解大資料主要是通過資料視覺化,而詞云作為資料視覺化中較為直觀 強烈的視覺衝擊,也越來越受到人們的重視。廢話不多說,先給大家展示一下效果。展示 import xlrd import jieba import ...

視覺化文字資料 詞云

在r語言的包裡面,有乙個wordcloud的包,專門用來建立這種型別的圖形,它是由加州大學洛杉磯分校的專業統計學家ian fellows編寫的。下面用幾句簡單的r語言即可繪製出一張詞云 library wordcloud library tm library nlp getwd sms corpus...

R語言資料視覺化詞云繪製

jiebar,jiebard 分詞 wordcloud2 繪製詞云 installpackage jiebar jiebard wordcloud2 安裝程式包library jiebar,jiebard a需要將對研究無意義的詞去除,再次只提供了示例 stopwords class stopwor...