原文連線
咱們書接上回,講到我們使用python把紅樓夢中的核心詞彙給繪畫出來了,但是,紅樓夢這麼唯美的書,給我們烏漆麻黑的搞了一張詞云,寶寶們肯定接受不了。
我們先來找**,這張**不錯,不過還是要處理一下,把背景處理稱為白色,這個時候,ps工具可以簡單地達到這個效果。
接著,我們就要來寫程式了,老規矩,我們先來匯入包:
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import wordcloud, imagecolorgenerator
把讀取進去,然後重新設定一下wordcloud物件,設定mask為我們的。
bimg = imread("d:\\賈寶玉.png")
wordcloud = wordcloud(
background_color="white",
mask=bimg, font_path='d:\\simhei.ttf'
)接著,我們就可以美美地繪製詞云了。
wordcloud = wordcloud.fit_words(segstat.head(1000).itertuples(index=false))
bimgcolors = imagecolorgenerator(bimg)
plt.axis("off")
plt.imshow(wordcloud.recolor(color_func=bimgcolors))
plt.show()
長腿歐巴雖然好,但是畫起來,很明顯我們的詞彙分成兩大部分了,這樣子會分散我們的注意力,因此,我們使用人物作為背景繪製詞云的時候,最好只是使用上半身,使用頭像就更好了。因此,長腿歐巴拜拜。
bimg = imread("d:\\賈寶玉2.png")
wordcloud = wordcloud(
background_color="white",
mask=bimg, font_path='d:\\simhei.ttf'
)wordcloud = wordcloud.fit_words(segstat.head(1000).itertuples(index=false))
bimgcolors = imagecolorgenerator(bimg)
plt.axis("off")
plt.imshow(wordcloud.recolor(color_func=bimgcolors))
plt.show()
這樣子畫出來的詞云,是不是就唯美了很多了呢?希望你們喜歡,欲知後事如何,歡迎微博關注@大資料分析實戰,我們下回再見。
紅樓夢詞云製作(帶背景)
初學望批評指正。紅樓詞云帶背景圖的那種。原始影象 最終用ps合成的圖。其實挺唏噓的,一般人認為黛玉是絕對的女主,但是黛玉只出現了900多次,不及賈母3000次 鳳姐的1000次。這個是人物出場次數統計 這個是我的另乙個帖子,紅樓夢人物出場統計 最終的成片。摳圖畢竟簡陋。源 如下 elif word ...
python 統計紅樓夢人員姓名出現次數
使用到jieba庫 python 第三方中文分詞庫 1 安裝jieba庫 2 紅樓夢 txt 文件 import jieba txt open 紅樓夢.txt r encoding utf 8 read wenben jieba.lcut txt 使用精確模式對文字進行分詞 counts 通過鍵值對...
PYTHON中JIEBA分詞關於紅樓夢出現的高頻詞
import jieba excludes txt open 紅樓夢.txt r encoding utf 8 read words jieba.lcut txt 利用jieba庫將紅樓夢的所有語句分成詞彙 counts 建立的乙個空的字典 for word in words if len word...