python 詞云手把手 手把手教你生成炫酷的詞云

2021-10-11 22:38:13 字數 2426 閱讀 9084

前言:

話說,在這個大資料時代,獲取資訊顯得極為容易,可正是如此,我們想要對資訊進行直觀地了解難度就大了。excel是乙個很好的資料視覺化方法,不過有時候我們的資料**可能並不是一張或者多張excel**,這樣子的話如果我們想利用excel進行資料視覺化就顯得不是那麼容易。

首先我們需要逐個將資料匯入到excel中,然後再用excel的圖表對資料進行視覺化分析。在資訊量大的情況下,這麼做顯然得不償失,我們只是想對資料進行乙個直觀的了解,為什麼要搞得這麼複雜呢?

是不是非常直觀並且炫酷呢?

安裝方法如下

pip install matplotlib

pip install numpy

pip install jieba

以上的三個命令的作用是分別安裝:matplotlib,numpy以及jieba這三個庫。當然有些同學可能已經安裝過了。想要檢驗是否有安裝,可以在命令列下輸入:pip list

這樣子即可顯示你已經安裝的庫,如果沒有全部出現上面的3個庫,請在命令列下執行對應的命令並且等待安裝成功。

如果你沒有安裝python或者輸入pip顯示不是內部命令,請移步這篇文章

# worcloud是生成詞云的關鍵

import wordcloud

# numpy是乙個強大的科學計算庫,我們將用它來把pil庫開啟的儲存為陣列

import numpy as np

# pil是乙個影象處理庫,用來開啟

from pil import image

# jieba是中文分詞庫,可以智慧型地拆分詞語

import jieba

# matplotlib庫是乙個繪相簿,可以用來顯示以及繪製多種圖形

import matplotlib.pyplot as plt

# 生成背景的兩種方法#

# 注意背景的路徑要寫對,可以是完整路徑,例如c:/image/test.jpg

# 若與python**在同乙個資料夾,那可以直接寫名稱+字尾,例如test.jpg

# 1.使用 matplotlib庫讀取

# background_image_1.jpg是背景的檔名,要替換為你自己的

# 2.使用numpy庫和pil庫,pil庫用於開啟,numpy庫用於將轉化為陣列

# 下面這行**我注釋掉了

# 對於以上的選擇,要特別注意的背景應該為白色

#配置詞云的背景,,字型大小等引數,

# 也可以不配置,直接 wc=wordcloud.wordcloud()

wc=wordcloud.wordcloud(

# font_path為字型檔案的路徑,如果沒有這個,那麼生成的詞云無法顯示中文

font_path="c:/windows/fonts/simfang.ttf",

# scale為按比例放大或者縮小生成的。例如1.5表示放大為原來的1.5倍,可省略

scale=1.5,

# mask表示背景,如果不沒有背景,那這個可以省略

mask=bg_1,

# background_color為背景顏色,預設為黑色,可以省略

background_color="black",

# width為詞云生成的寬度,預設為400

width=600,

# height為詞云生成的高度,預設為200

height=400,

# max_words上顯示的最大詞語的個數

max_words=1000,

# max_font_size為最大字型的大小

max_font_size=120,

# min_font_size為最小字型大小,預設為4

min_font_size=4)

# 開啟要生成詞云的檔案,一般是txt格式的純文字文件

# 詞云**.txt 要替換成存有你要轉化為詞云的資訊檔案的檔名

with open('詞云**.txt','r',encoding="utf-8") as f:

# text=f.read()是說讀取 詞云**.txt 這個檔案的所有內容並儲存到變數text中

text=f.read()

# 利用jieba庫把text拆分並且使用空格分隔拆分後的結果

spilt_text=" ".join(jieba.lcut(text))

print("正在生成詞云......")

# 呼叫generate方法,傳入要生成詞云的文字即可生成詞云

wc.generate(spilt_text)

# 把詞云儲存成

print("生成完畢!")

效果展示背景生成的詞云

手把手教您改錯賬

自 http cloudorsunorrain.spaces.live.com blog 做為一名財會人員,謹慎的工作態度是做好會計工作的前提,但是填製會計憑證或登記賬簿時由於疏忽會偶爾發生一些差錯,對產生的這些差錯,如何查詢並更正呢?我們通過以下幾方面的介紹,幫您完善會計工作。追本溯源 教您找錯賬...

手把手教您完成Elasticsearch資料遷移

您可以通過logstash reindex和oss等多種方式在elasticsearch之間遷移資料。本文以阿里雲elasticsearch 簡稱es 為例,介紹阿里雲elasticsearch間資料遷移 自建es資料遷移至阿里雲es和第三方es遷移至阿里雲es的方案,幫助您根據業務選擇合適的場景進...

Thinkphp手把手練習

準備條件 thinkphp框架 1.在apache的www目錄下新建資料夾,命名為thinkphp,可以將thinkphp框架放在該目錄中。確定應用名稱 確定應用路徑 開啟除錯模式 應用核心檔案,這裡根據thinkphp的路徑決定,此處用的是相對路徑 require thinkphp thinkph...