python生成中文詞云 python生成詞云

2021-10-11 02:04:26 字數 831 閱讀 6904

生成詞云還挺簡單的。就用wordcloud庫就可以生成。wordcloud用的內容可以是字串,也可以是dict.生成中文資訊的時候要指定字型檔案。不然返回的都是方塊。

關於扒網頁資訊。要注意的是在header裡放一些user-agent一類的東西(假裝是真的有人從瀏覽器點開)。不然可能**會識別出來,啥都不返回。返回值需要encode成utf-8,不然中文顯示是十六進製制的。

json包是可以直接把字串解析成json的。

具體看**就好

生成結果

import requests

import json

import matplotlib.pyplot as plt

from wordcloud import wordcloud

headers=")+1])

webcontent = jsondata["data"] #title htmlname

#generate word cloud

cloudstr = ""

for content in webcontent:

cloudstr += content["title"]

#font_path is used for chinese characters

cloud = wordcloud(font_path="c:\windows\fonts\msyhbd.ttc",background_color="white",width=1000,height=860,margin=2).generate(cloudstr)

plt.imshow(cloud)

plt.axis("off")

plt.show()

python中文詞云生成

一 詞云 二 python實現中文詞云顯示 1 需要準備的python庫包括,matplotlib,jieba和wordcloud,可以通過pip install 進行安裝。2 實現 coding utf 8 生成txt檔案的詞云 import matplotlib.pyplot as plt fr...

Python生成中文詞云

建立專案資料夾 mywordcloud 命令列輸入 cd mywordcloud python m venv virenv pip install numpy pip install wordcloud python m pip install u pip setuptools 安裝matplotl...

中文詞頻統計與詞云生成

中文詞頻統計 追風箏的人 txt 2.從檔案讀取待分析文字。3.安裝並使用jieba進行中文分詞。pip install jieba import jieba jieba.lcut text 4.更新詞庫,加入所分析物件的專業詞彙。jieba.add word 天罡北斗陣 逐個新增 jieba.lo...