人工智慧入門實踐 詞云

2021-10-02 04:46:15 字數 2477 閱讀 4326

關於hsl配色方案可以參考

配色方案

精細控制

如果希望精細地控制詞云**現的詞,以及每個詞的大小,可以嘗試generate_from_frequencies(), 包含兩個引數

#字型路徑,需要展現什麼字型就把該字型路徑+字尾名寫上,如:font_path = '黑體.ttf'

font_path : string

# 輸出的畫布寬度,預設為400畫素

width :

int(default=

400)

# 輸出的畫布高度,預設為200畫素

height :

int(default=

200)

# 詞語水平方向排版出現的頻率,預設 0.9 (所以詞語垂直方向排版出現頻率為 0.1 )

prefer_horizontal :

float

(default=

0.90

)# 如果引數mask為空,則使用二維遮罩繪製詞云。

# 如果 mask 非空,設定的寬高值將被忽略,遮罩形狀被 mask 取代。

# 除全白(#ffffff)的部分將不會繪製,其餘部分會用於繪製詞云。如:bg_pic = imread('讀取一張.png'),背景的畫布一定要設定為白色(#ffffff),然後顯示的形狀為不是白色的其他顏色。可以用ps工具將自己要顯示的形狀複製到乙個純白色的畫布上再儲存,就ok了。

mask : nd-array or

none

(default=

none

)# 按照比例進行放大畫布,如設定為1.5,則長和寬都是原來畫布的1.5倍。

scale :

float

(default=1)

# 顯示的最小的字型大小

min_font_size :

int(default=4)

# 字型步長,如果步長大於1,會加快運算但是可能導致結果出現較大的誤差。

font_step :

int(default=1)

# 要顯示的詞的最大個數

max_words : number (default=

200)

# 設定需要遮蔽的詞,如果為空,則使用內建的stopwords

stopwords :

set of strings or

none

# 背景顏色,如background_color='white',背景顏色為白色。

background_color : color value (default=」black」)

# 顯示的最大的字型大小

max_font_size :

intor

none

(default=

none

)# 當引數為「rgba」並且background_color為none時,背景為透明。

mode : string (default=」rgb」)

# 詞頻和字型大小的關聯性

relative_scaling :

float

(default=.5)

# 生成新顏色的函式,如果為空,則使用 self.color_func

color_func :

callable

, default=

none

# 使用正規表示式分隔輸入的文字

regexp : string or

none

(optional)

# 是否包括兩個詞的搭配

collocations :

bool

, default=

true

# 給每個單詞隨機分配顏色,若指定color_func,則忽略該方法。

colormap : string or matplotlib colormap, default=」viridis」

# 根據詞頻生成詞云

fit_words(frequencies)

# 根據文字生成詞云

generate(text)

# 根據詞頻生成詞云

generate_from_frequencies(frequencies[,.

..])

# 根據文字生成詞云

generate_from_text(text)

# 將長文字分詞並去除遮蔽詞(此處指英語,中文分詞還是需要自己用別的庫先行實現,使用上面的 fit_words(frequencies) )

process_text(text)

# 對現有輸出重新著色。重新上色會比重新生成整個詞云快很多。

recolor(

[random_state, color_func, colormap]

)# 轉化為 numpy array

to_array(

)# 輸出到檔案

to_file(filename)

人工智慧入門01 什麼是人工智慧

圖靈測試 turing test 由艾倫 圖靈 alan turing 在1950年發明,指測試者與被測試者 乙個人和一台機器 隔開的情況下,通過一些裝置 如鍵盤 向被測試者隨意提問。測試滿足三個條件 進行多次測試後,如果機器讓平均每個詢問者做出超過30 的誤判,那麼這台機器就通過了測試,並被認為具...

人工智慧AI入門

當然讀這些書的時候,最好要有高等數學 線性代數 概率論的知識。1 python機器學習基礎課程 確實很基礎,可以了解到什麼是監督學習 非監督學習,以及一些相應的演算法。2 李航 統計學習方法 也是監督學習 非監督學習,演算法較多,公式較多。但推導過程少,看起來應該費勁些。3 深度學習 講了不少神經網...

人工智慧實踐教程(一)

本文為 人工智慧實踐教程 學習總結和感悟,先寫書中內容,再寫自己的思考 2017年10月20日,實驗室 現在人工智慧就是用計算機去模擬人類智慧型。為什麼計算機可以模擬人類的智慧型?這是因為人和計算機都是物理符號系統。能夠實現輸入符號 輸出符號 儲存符號 複製符號 通過找出符號間關係建立符號結構 條件...