python中文詞云生成

2021-08-01 00:02:46 字數 1354 閱讀 1578

一、詞云

二、python實現中文詞云顯示

1、需要準備的python庫包括,matplotlib,jieba和wordcloud,可以通過pip install ---進行安裝。

2、**實現

#-*-coding:utf-8-*-

###生成txt檔案的詞云

import matplotlib.pyplot as plt

from wordcloud import wordcloud

import jieba

text = open("zetianji.txt","rb").read()

#結巴分詞

wordlist = jieba.cut(text,cut_all=true)

wl = " ".join(wordlist)

#print(wl)#輸出分詞之後的txt

#把分詞後的txt寫入文字檔案

#fencitxt = open("fencihou.txt","w+")

#fencitxt.writelines(wl)

#fencitxt.close()

#設定詞云

wc = wordcloud(background_color = "black", #設定背景顏色

#mask = "", #設定背景

max_words = 2000, #設定最大顯示的字數

#stopwords = "", #設定停用詞

font_path = "fangsong_gb2312.ttf",

#設定中文字型,使得詞云可以顯示(詞云預設字型是「droidsansmono.ttf字型庫」,不支援中文)

max_font_size = 50, #設定字型最大值

random_state = 30, #設定有多少種隨機生成狀態,即有多少種配色方案

)myword = wc.generate(wl)#生成詞云

#展示詞雲圖

plt.imshow(myword)

plt.axis("off")

plt.show()

說明:wordcloud 預設使用了droidsansmono.ttf 字型庫,要顯示中文需要新增乙個支援中文的ttf 字型檔;

**中用到了字型:仿宋-gb2312字型

3、效果截圖

以下顯示的是《擇天記》中的一章內容。

三、參考鏈結

Python生成中文詞云

建立專案資料夾 mywordcloud 命令列輸入 cd mywordcloud python m venv virenv pip install numpy pip install wordcloud python m pip install u pip setuptools 安裝matplotl...

python生成中文詞云 python生成詞云

生成詞云還挺簡單的。就用wordcloud庫就可以生成。wordcloud用的內容可以是字串,也可以是dict.生成中文資訊的時候要指定字型檔案。不然返回的都是方塊。關於扒網頁資訊。要注意的是在header裡放一些user agent一類的東西 假裝是真的有人從瀏覽器點開 不然可能 會識別出來,啥都...

中文詞頻統計與詞云生成

中文詞頻統計 追風箏的人 txt 2.從檔案讀取待分析文字。3.安裝並使用jieba進行中文分詞。pip install jieba import jieba jieba.lcut text 4.更新詞庫,加入所分析物件的專業詞彙。jieba.add word 天罡北斗陣 逐個新增 jieba.lo...