1. 準備
安裝好python,安裝時包含pip 包管理工具
pip install jieba
pip install matplotlib
import matplotlib.pyplot as plt #數學繪相簿
import jieba #分詞庫
from wordcloud import wordcloud #詞云庫
2. 示例**
import matplotlib.pyplot as plt #數學繪相簿
import jieba #分詞庫
from wordcloud import wordcloud #詞云庫
#1、讀入txt文字資料
text = open(r'd:\\code\\document\\tonghua.txt',"r").read()
#2、結巴分詞,預設精確模式。可以新增自定義詞典userdict.txt,然後jieba.load_userdict(file_name) ,file_name為檔案類物件或自定義詞典的路徑
# 自定義詞典格式和預設詞庫dict.txt一樣,乙個詞佔一行:每一行分三部分:詞語、詞頻(可省略)、詞性(可省略),用空格隔開,順序不可顛倒
cut_text= jieba.cut(text)
result= "/".join(cut_text)#必須給個符號分隔開分詞結果來形成字串,否則不能繪製詞云
#print(result)
#無自定義背景圖:需要指定生成詞雲圖的畫素大小,預設背景顏色為黑色,統一文字顏色:mode='rgba'和colormap='pink'
wc = wordcloud(font_path=r"d:\\code\\python\\monaco yahei.ttf",background_color='white',width=800,height=600,max_font_size=50,
max_words=1000)#,min_font_size=10)#,mode='rgba',colormap='pink')
wc.generate(result)
wc.to_file(r"d:\\code\\python\\cat.png") #按照設定的畫素寬高度儲存繪製好的詞雲圖,比下面程式顯示更清晰
# 4、顯示
plt.figure("詞雲圖") #指定所繪圖名稱
plt.imshow(wc) # 以的形式顯示詞云
plt.axis("off") #關閉影象座標系
plt.show()
中文詞云注意編碼問題,以下**實現了中文詞云,加入了停用詞庫,可以自定義詞雲形狀
# -*- coding: utf-8 -*-
#wordcloud生成中文詞云
from wordcloud import wordcloud
import codecs
import jieba
#import jieba.analyse as analyse
from scipy.misc import imread
import os
from os import path
import matplotlib.pyplot as plt
from pil import image, imagedraw, imagefont
# 繪製詞云
def draw_wordcloud():
#讀入乙個txt檔案
comment_text = open('d:\\code\\python\\text\\tonghua.txt','r',encoding='gb18030').read()
#讀取本地停當詞庫
stopwords = open('d:\\code\\python\\text\\stopwords.txt','r',encoding='utf-8').read().split("\n")
#結巴分詞,生成字串,如果不通過分詞,無法直接生成正確的中文詞云
cut_text = " ".join(jieba.cut(comment_text))
d = path.dirname(__file__) # 當前檔案資料夾所在目錄
color_mask = imread("d:\\code\\python\\text\\fangzi.png") # 讀取背景
cloud = wordcloud(
#設定字型,不指定就會出現亂碼
font_path="d:\\code\\python\\text\\monaco yahei.ttf",
#font_path=path.join(d,'simsun.ttc'),
#設定背景色
background_color='black',
stopwords= stopwords,
#詞云形狀
mask=color_mask,
#允許最大詞彙
max_words=200,
#最大號字型
max_font_size=400
word_cloud = cloud.generate(cut_text) # 產生詞云
word_cloud.to_file("pjl_cloud4.jpg") #儲存
# 顯示詞云
plt.imshow(word_cloud)
plt.axis('off')
plt.show()
if __name__ == '__main__':
draw_wordcloud()
python詞云調整字型顏色方法
配合上次的詞云 用colormap string or matplotlib colormap,default viridis 給每個單詞隨機分配顏色,若指定color func,則忽略該方法。不會用color func方法,所以就找到乙個這種方法 import matplotlib.pyplot ...
python電影名稱詞云 python 詞云
1 寫詞云的思路 資料採集 分詞 生成詞云 2 用到的模組 wordcloud。如果沒有這個模組,cmd進入python所在目錄的scripts資料夾,通過pip安裝。pip install wordcloud。安裝出現以下錯誤 3 開始編碼 匯入模組 from wordcloud import w...
mac終端輸入python預設開啟python3
1.終端開啟 bash profile檔案 open bash profile 2.新增以下內容到.bash profile檔案 setting path for python 3.5 path library frameworks python.framework versions 3.5 bin...