生成詞云還挺簡單的。就用wordcloud庫就可以生成。wordcloud用的內容可以是字串,也可以是dict.生成中文資訊的時候要指定字型檔案。不然返回的都是方塊。
關於扒網頁資訊。要注意的是在header裡放一些user-agent一類的東西(假裝是真的有人從瀏覽器點開)。不然可能**會識別出來,啥都不返回。返回值需要encode成utf-8,不然中文顯示是十六進製制的。
json包是可以直接把字串解析成json的。
具體看**就好
生成結果
import requests
import json
import matplotlib.pyplot as plt
from wordcloud import wordcloud
headers=")+1])
webcontent = jsondata["data"] #title htmlname
#generate word cloud
cloudstr = ""
for content in webcontent:
cloudstr += content["title"]
#font_path is used for chinese characters
cloud = wordcloud(font_path="c:\windows\fonts\msyhbd.ttc",background_color="white",width=1000,height=860,margin=2).generate(cloudstr)
plt.imshow(cloud)
plt.axis("off")
plt.show()
python中文詞云生成
一 詞云 二 python實現中文詞云顯示 1 需要準備的python庫包括,matplotlib,jieba和wordcloud,可以通過pip install 進行安裝。2 實現 coding utf 8 生成txt檔案的詞云 import matplotlib.pyplot as plt fr...
Python生成中文詞云
建立專案資料夾 mywordcloud 命令列輸入 cd mywordcloud python m venv virenv pip install numpy pip install wordcloud python m pip install u pip setuptools 安裝matplotl...
中文詞頻統計與詞云生成
中文詞頻統計 追風箏的人 txt 2.從檔案讀取待分析文字。3.安裝並使用jieba進行中文分詞。pip install jieba import jieba jieba.lcut text 4.更新詞庫,加入所分析物件的專業詞彙。jieba.add word 天罡北斗陣 逐個新增 jieba.lo...