python詞云隨筆

2021-09-26 00:24:18 字數 2762 閱讀 6458

詞云:指突出中心的片語群,就是對文字**現頻率較高的「關鍵字(詞)」,給予視覺上的突出顯示,形成關鍵字詞云,使瀏覽者一眼就可以掌握文字的大概資訊。如下圖:

準備工作:

1.配置python環境

2.安裝所需要的第三方庫:wordcloud庫,imageio庫,jieba庫,matplotlib庫

import wordcloud

from imageio import imread# 用於png模式的匯入

mk=imread(

"心形形狀.png"

)# 作為詞云的形狀,路徑在當前原始檔中時省略

f =open

("c:\\users\\lu\\desktop\\哈姆雷特.txt"

)# 開啟英文文字

t = f.read(

)f.close(

)w = wordcloud.wordcloud( \

width =

1000

, height =

700,\

background_color =

"white"

, font_path =

"msyh.ttc"

, mask=mk,

max_words=

300)

# 建立詞云物件

w.generate(t)

# j將文字加入詞云物件中

w.to_file(

"哈姆雷特詞云.png"

)# 輸出

import jieba# 利用jieba庫對中文文字進行分詞

import wordcloud

from imageio import imread

mk=imread(

"心形形狀.png"

)f =

open

("c:\\users\\lu\\desktop\\全面建成小康社會.txt"

,"r"

, encoding=

"utf-8"

)# 開啟中文文字,utf-8為文字編碼格式

t = f.read(

)f.close(

)ls = jieba.lcut(t)

# 對中文文字進行分詞

txt =

" ".join(ls)

# 用空格分隔上面分好的片語列表

w = wordcloud.wordcloud( \

width =

1000

, height =

700,\

background_color =

"white"

, font_path =

"msyh.ttc"

, mask=mk,

max_words=

1000

)w.generate(txt)

w.to_file(

"全面建成小康社會詞云詞云.png"

注意:

如果覆蓋層為jpg格式,則用matplotlib庫的matplotlib.pyplot.imread()函式匯入

如果覆蓋層為png格式,則用imageio庫imageio.imread()函式匯入

覆蓋層的背景必須是白色,因為詞云填充時是在非白色區域顯示詞云,從而形成詞云的形狀

**如下:

import jieba# 利用jieba庫對中文文字進行分詞

import wordcloud

import matplotlib.pyplot as plt# jpg模式

mk=plt.imread(

"中國地圖形狀.jpg"

)f =

open

("c:\\users\\lu\\desktop\\全面建成小康社會.txt"

,"r"

, encoding=

"utf-8"

)# 開啟中文文字,utf-8為文字編碼格式

t = f.read(

)f.close(

)ls = jieba.lcut(t)

# 對中文文字進行分詞

txt =

" ".join(ls)

# 用空格分隔上面分好的片語列表

w = wordcloud.wordcloud( \

width =

1000

, height =

700,\

background_color =

"white"

, font_path =

"msyh.ttc"

, mask=mk,

max_words=

1000

)w.generate(txt)

w.to_file(

"全面建成小康社會詞云詞云.jpg"

python電影名稱詞云 python 詞云

1 寫詞云的思路 資料採集 分詞 生成詞云 2 用到的模組 wordcloud。如果沒有這個模組,cmd進入python所在目錄的scripts資料夾,通過pip安裝。pip install wordcloud。安裝出現以下錯誤 3 開始編碼 匯入模組 from wordcloud import w...

python實現詞云

自己用 生成自己的詞云,複雜麼?需要很長時間麼?很多文字都介紹過各種的方法,但實際上只需要10行python 即可。import matplotlib.pyplot as plt from wordcloud import wordcloud import jieba text from file ...

Python 生成詞云

import matplotlib.pyplot as plt from wordcloud import wordcloud import jieba text from file with apath open python.txt encoding utf 8 read wordlist af...