今天在學python的利用wordcloud庫製作一些簡單的視覺化詞云。下面梳理一下今天遇到的幾個坑:
坑一
import imageio
mask = imageio.imread('chinamask.png')
坑二
第二個就是出來的結果,上沒有漢字,都是各個顏色的方框,後來了解到是因為沒有設定中文字型
wordcloud = wordcloud( font_path='msyh.ttc').generate(newtxt) #微軟雅黑字型(msyh.ttc)
坑三
如果遇到字跡不清楚的,可以在wordcloud裡設定引數scale=4,數字越大越清楚,要求電腦配置也就越高。可參考文章用python和wordcloud繪製詞云(內附讓字型清晰的秘笈)
附源**及效果:
```python
from wordcloud import wordcloud
import jieba
import imageio
mask = imageio.imread('chinamask.png')
f = open('shijiuda.txt','r',encoding='utf-8')
#f='''同學們可將感興趣的段落複製於此來製作詞云
#。'''
txt = f.read()
words=jieba.lcut(txt) #精確分詞
newtxt=''.join(words) #空格拼接
wordcloud = wordcloud(background_color='white',
font_path='msyh.ttc',
width=800,
height=600,
max_words=200,
max_font_size=80,
mask=mask,
).generate(newtxt)
wordcloud.to_file('china.png') #決定詞云形狀的
效果圖因涉及政治因素一直審核不通過就被刪了 python 資料視覺化 詞云
近年來,大資料等一系列字眼開始進入到普通老百姓的生活中,但大部分老百姓對其知之甚少。人們通常了解大資料主要是通過資料視覺化,而詞云作為資料視覺化中較為直觀 強烈的視覺衝擊,也越來越受到人們的重視。廢話不多說,先給大家展示一下效果。展示 import xlrd import jieba import ...
python 視覺化庫
在做titanic分析的過程中,看了一些大神的想法,發現在分析資料的過程中,許多大神會使用到seaborn,plotly這些庫,而我等小白僅僅知道matplotlib這個唯一的資料視覺化庫而已。上網查詢資料後整理如下 資料視覺化庫可以根據其應用場景來分為以下幾類 基礎的2d,3d圖繪製庫,互動資訊視...
視覺化文字資料 詞云
在r語言的包裡面,有乙個wordcloud的包,專門用來建立這種型別的圖形,它是由加州大學洛杉磯分校的專業統計學家ian fellows編寫的。下面用幾句簡單的r語言即可繪製出一張詞云 library wordcloud library tm library nlp getwd sms corpus...