近年來,大資料等一系列字眼開始進入到普通老百姓的生活中,但大部分老百姓對其知之甚少。人們通常了解大資料主要是通過資料視覺化,而詞云作為資料視覺化中較為直觀、強烈的視覺衝擊,也越來越受到人們的重視。
廢話不多說,先給大家展示一下效果。
**展示:
import xlrd
import jieba
import matplotlib.pylab as plt
from wordcloud import wordcloud
from collections import counter
def getexceldata(excel,txt):
readbook = xlrd.open_workbook(excel)
sheet = readbook.sheet_by_index(1) #取第二個sheet頁
rows = sheet.nrows
i = 0
while i < rows:
txt += sheet.cell(i, 7).value #取第三列的值
i += 1
seg_list = jieba.cut(txt)
c = counter()
result = {}
for x in seg_list:
if len(x) > 1 and x != '\r\n':
c[x] += 1
for (k, v) in c.most_common():
result[k] = v #放到字典中,用於生成詞云的源資料
return result
def makewordcloud(txt):
x, y = np.ogrid[:300, :500]
mask = (x - 150) ** 2 + (y - 150) ** 2 > 150 ** 2
mask = 255 * mask.astype(int)
#此處可以設定詞云的形態
wc = wordcloud(background_color="white",
max_words=500,
mask=mask,
repeat=true,
width=1000,
height=1000,
scale=4, #這個數值越大,產生的解析度越高,字跡越清晰
font_path="c:/windows/fonts/simfang.ttf")
wc.generate_from_frequencies(txt)
wc.to_file('abc.png')
plt.axis("off")
plt.imshow(wc, interpolation="bilinear")
plt.show()
if __name__ == '__main__':
txt = ''
makewordcloud(getexceldata('銷量.xlsx', txt))
、
詞雲圖:
我們還可以選擇任意的形狀,比如用著張作為形狀。
還有字型和顏色,這些都是可以修改的喔,在這裡就不一一介紹。
如果文章對您有幫助,麻煩點讚支援一下,謝謝啦!
視覺化文字資料 詞云
在r語言的包裡面,有乙個wordcloud的包,專門用來建立這種型別的圖形,它是由加州大學洛杉磯分校的專業統計學家ian fellows編寫的。下面用幾句簡單的r語言即可繪製出一張詞云 library wordcloud library tm library nlp getwd sms corpus...
R語言資料視覺化詞云繪製
jiebar,jiebard 分詞 wordcloud2 繪製詞云 installpackage jiebar jiebard wordcloud2 安裝程式包library jiebar,jiebard a需要將對研究無意義的詞去除,再次只提供了示例 stopwords class stopwor...
大資料視覺化案例一 詞云
詞云 詞雲圖過濾掉大量的文字資訊,使瀏覽網頁者只要一眼掃過文字就可以領略文字的主旨。在之前通過爬蟲獲得新冠肺炎資料之後,使用詞云來直觀反映哪些地區的疫情較嚴重。字越大反映越嚴重 第一步 讀取excel資料 import openpyxl wb openpyxl.load workbook data....