開發環境:python2.7
需要的庫:wordcloud,jieba,matplotlib
通過jieba分詞將讀取的文字分成字串,通過wordcloud生成詞云,根據詞頻來顯示特色詞云,讓人更加直觀的明白文字的詞頻最大的文字
在寫**之前我們要引入庫
import sys
from wordcloud import wordcloud
import jieba
from scipy.misc import imread
import matplotlib.pyplot as plt
reload(sys)
sys.setdefaultencoding("utf-8")
# 讀入文字
comment_text = open('test.txt','r').read()
# 結巴分詞,生成字串,如果不通過分詞,無法直接生成正確的中文詞云
cut_text = " ".join(jieba.cut(comment_text))
print cut_text
# 讀取背景
color_mask = imread('background.png')
cloud = wordcloud(
# 設定背景色
background_color='black',
# 詞云形狀
mask=color_mask,
#允許最大詞彙
max_words=2000,
# 設定字型,不設定可能出現亂碼
font_path="stfangso.ttf",
#最大號字型
max_font_size=100,
)# 產生詞云
word_cloud = cloud.generate(cut_text)
# 儲存
# 顯示詞云
plt.imshow(word_cloud)
plt.show()
效果如下:
python預設詞云顏色 Python 繪製詞云
1.準備 安裝好python,安裝時包含pip 包管理工具 pip install jieba pip install matplotlib import matplotlib.pyplot as plt 數學繪相簿 import jieba 分詞庫 from wordcloud import wo...
詞頻統計和詞云繪製
import os os.chdir r d text text1 for root,dirs,files in os.walk r d 綠色金融文字庫 for i in files path os.path.join root,i with open path,r encoding gb18030...
python電影名稱詞云 python 詞云
1 寫詞云的思路 資料採集 分詞 生成詞云 2 用到的模組 wordcloud。如果沒有這個模組,cmd進入python所在目錄的scripts資料夾,通過pip安裝。pip install wordcloud。安裝出現以下錯誤 3 開始編碼 匯入模組 from wordcloud import w...