詞云:
詞雲圖過濾掉大量的文字資訊,使瀏覽網頁者只要一眼掃過文字就可以領略文字的主旨。
在之前通過爬蟲獲得新冠肺炎資料之後,使用詞云來直觀反映哪些地區的疫情較嚴重。(字越大反映越嚴重)
第一步:讀取excel資料
import openpyxl第二步:過濾資料並且獲得國內疫情資料的地點與確診人數資料wb = openpyxl.load_workbook('data.xlsx')
ws = wb['國內疫情']第三步:詞云frequency_in = {}
for row in ws.values:
if row[0] == '省份':
pass
else:
frequency_in[row[0]] = float(row[1])
from wordcloud import wordcloud其中使用c:/windows/fonts/simli.ttf表示中文隸書的表示方式,也可以使用其他的表示方式。#中文隸書
wordcloud = wordcloud(font_path='c:/windows/fonts/simli.ttf',
background_color="white",
width=1920,height=1080)
第四步:構建詞云
#資料確診病例生成詞云國內疫情詞云結果:wordcloud.generate_from_frequencies(frequency_in)
#儲存詞云
wordcloud.to_file('wordcloud_in.png')
接下來繪製國外的詞云:
首先從不同的sheet裡獲取資料:
frequency_out = {}接下來繪製詞云:sheet_name = wb.sheetnames
for each in sheet_name:
if "洲" in each:
ws = wb[each]
for row in ws.values:
if row[0] == '國家':
pass
else:
frequency_out[row[0]] = float(row[1])
#資料確診病例生成詞云結果展示:wordcloud.generate_from_frequencies(frequency_out)
#儲存詞云
wordcloud.to_file('wordcloud_out.png')
python 資料視覺化 詞云
近年來,大資料等一系列字眼開始進入到普通老百姓的生活中,但大部分老百姓對其知之甚少。人們通常了解大資料主要是通過資料視覺化,而詞云作為資料視覺化中較為直觀 強烈的視覺衝擊,也越來越受到人們的重視。廢話不多說,先給大家展示一下效果。展示 import xlrd import jieba import ...
視覺化文字資料 詞云
在r語言的包裡面,有乙個wordcloud的包,專門用來建立這種型別的圖形,它是由加州大學洛杉磯分校的專業統計學家ian fellows編寫的。下面用幾句簡單的r語言即可繪製出一張詞云 library wordcloud library tm library nlp getwd sms corpus...
R語言資料視覺化詞云繪製
jiebar,jiebard 分詞 wordcloud2 繪製詞云 installpackage jiebar jiebard wordcloud2 安裝程式包library jiebar,jiebard a需要將對研究無意義的詞去除,再次只提供了示例 stopwords class stopwor...