首先需要進行對資訊進行爬取,然後將爬取內容放在txt檔案中利用jieba模板進行文書處理,再用處理過的文字資料進行詞云繪製
import jieba
defcut_data()
:with
open
("comment.txt"
,"r"
,encoding=
"utf-8"
)as f:
data=f.read(
)#讀取資料
cut_text=
" ".join(jieba.cut(data)
)#用空格分隔兩個分詞的的詞語
with
open
("data.txt"
,"a"
,encoding=
"utf-8"
)as f:
f.write(cut_text)
cut_data(
)
from wordcloud import wordcloud,stopwords,imagecolorgenerator
import matplotlib.pylab as plt
import codecs
from imageio import imread
import os
class
get_wordcloud
:def
__init__
(self)
:#存放字型路徑、分詞之後的資料路徑、路徑
:#處理資料型別和文字資料型別的函式
d=os.path.dirname(__file__)
#獲取當前檔案的操作路徑
image=imread(self.image_path)
#將轉換為多維陣列
text=codecs.
open
(os.path.join(d,self.data_path)
,"rb"
,encoding=
"utf-8"
).read(
)#用二進位制的方法讀取分詞資料
self.draw_wordcloud(image,text)
defdraw_wordcloud
(self,image,text)
:#繪製詞云的函式
stopwords=
set(stopwords)
#使用預設的遮蔽詞彙
#傳入生成詞云的引數 字型位置 陣列 遮蔽字 背景顏色 最大詞數 字型最大限制
wordcloud=wordcloud(font_path=self.font_path,mask=image,stopwords=stopwords,
background_color=
"white"
,max_words=
1000
,max_font_size=
200)
.generate(text)
image_color=imagecolorgenerator(image)
#讓生成詞云的字型顏色隨著的顏色變化
)#設定詞云名稱
plt.imshow(wordcloud.recolor(color_func=image_color)
)#生成詞云時的顏色
plt.axis(
"off"
)#不顯示座標軸
plt.show(
)#生成詞云
get_word=get_wordcloud(
)get_word.get_info(
)
python 詞云製作
製作詞云需要兩個python核心類庫 準備乙個text文件,上面寫上要做的文字,以及一張作詞雲的背景圖 coding utf 8 import pil from os import path from pil import image import numpy as np import matplo...
Python生成詞云的製作
現成的詞云製作工具也很多 1.wordle是乙個用於從文字生成詞雲圖而提供的遊戲工具.3.tagul是乙個web服務,同樣可以建立華麗的詞云.4.tagcrowd還可以輸入web的url,直接生成某個網頁的詞云.詞云的本質是對文字中的詞進行詞云統計,根據出現頻率的多少來按比例展示大小.1.對文字資料...
實訓python的日記 python實訓第一天
實訓第一天總結 常量 常量也是變數,在python中大家都規定只要是大寫的變數都稱之為常量 使用者與程式互動 數字型別 整型int 浮點型float 字串型別 列表型別 字典型別 在 內,都逗號隔開,可存放多個值,每個值以key value的形式儲存 存 dict1 取 print dict1 na...