續上篇文章,總結下wordcloud2包,主要的函式包括wordcloud2()和letterword(),其中wordcloud2函式用於生成文字雲,而letterword能將詞云設定成文字形狀,接下來分別介紹這兩個函式。
wordcloud2(data, size = 1, minsize = 0, gridsize = 0,
fontfamily = 'segoe ui', fontweight = 'bold',
color = 'random-dark', backgroundcolor = "white",
minrotation = -pi/4, maxrotation = pi/4, shuffle = true,
rotateratio = 0.4, shape = 'circle', ellipticity = 0.65,
widgetsize = null, figpath = null, hoverfunction = null)
主要引數介紹:
(1) data: a data frame including word and freq in each column
(2) size:font size, default is 1. the larger size means the bigger word.
(3) fontfamily:字型,如"aril"
(4) fontweight:字型粗細,例如normal、bold、600
(5) color:字型色系,可以選"random-dark"或"random-light"
(6) backgroundcolor:color of the background.
(7) minrotation和maxrotation:文字旋轉角度的最小值和最大值
(8) rotateratio:字型旋轉比例,如果設定為1則全部的詞都會旋轉
(9) shape:詞云的形狀,可選的有:"circle"(圓形)、"star"(五角星)、"cardioid"(蘋果或心)、"diamond"(鑽石)、"********-forward"(三角形_平躺)、"********"(三角形_直立)、"pentagon"(五邊形)
(10) figpath:the path to a figure used as a mask.
lettercloud(data, word, wordsize = 0, letterfont = null, ...)
下面以包中自帶的資料集demofreqc為例介紹函式具體用法
library(wordcloud2)
wordcloud2(demofreqc,
size = 1,
shape = 'circle',
fontfamily = '微軟雅黑',
fontweight = "nornal",
rotateratio = 0.5,
color = "random-light",
backgroundcolor = 'snow')
wordcloud2(demofreqc,
size = 1,
fontfamily = '微軟雅黑',
fontweight = "600",
rotateratio = 1,
color = "random-dark",
backgroundcolor = 'snow',
figpath = '/library/frameworks/r.framework/versions/3.5/resources/library/wordcloud2/examples/t.png'
)
生成詞云如下:
除了內建的形狀以及的自定義形狀外,還能利用lettercloud函式生成自定義的文字形狀,如畫出r形狀的詞云,可以一下**
lettercloud(demofreqc, "r", wordsize = 0.3)
效果如下:
若想生成中文,需要用letterfont指出具體用的哪種中文字型,這就需要在使用之前了解自己的電腦有哪些中文字型,mac可以在字型冊例檢視,如果未指明字型,中文會亂碼,所有的字都生成乙個類似「口」的方框。
lettercloud(demofreqc, "分析", wordsize = 0.3,letterfont = 'hei')
效果如下:
總結:wordcloud2的功能還是非常齊全的,能生成很多形狀的詞云,除了包裡自帶的集中shape形狀,還可以用生成任意形狀,以及lettercloud生成任意文字形狀。
R語言 文字挖掘應用 標籤雲
雖然總有人對比python與r的實用性,但是作為資料分析的目標而言,工具不是重點,目標需求才是首要關注點,所以,今天嘗試用r自帶的一系列工具包來完成對於文字內容的挖掘,並利用標籤雲展示詞頻關係。工具包 程式設計環境 r編譯直譯器 rstudio 介面簡潔,操作方便,整合大量實用功能 挖掘展示過程 大...
R語言讀取Excel的神器 openxlsx
作為非程式猿的各位同志們,可能最擅長的資料整理軟體或者統計軟體就是 嗯,沒有錯,它就是集萬千寵愛於一身的e x o。咳咳咳,好了。隆重推出我們的主角 excel 事實上,excel是個super強大的軟體。基本上用它已經能完成大量的統計分析了。for example 各類數理統計 線性規劃 ling...
R語言 文字分類 1
因專案需要,結合自身專業知識,故而接觸了r語言及一些常用分類器。記錄下自己這乙個多月的學習歷程。與起源於貝爾實驗室的s語言類似,r也是一種為統計計算和繪圖而生的語言和環境,它是一套開源的資料分析解決方案,由乙個龐大且活躍的全球性研究型社群維護。r是一門指令碼語言,在繪圖方面有著非常強的能力,它可以讓...