我們經常想觀察一批資料的分布形態,直方圖、密度圖、箱線圖、小提琴圖和點圖等都是很好的實現形式。在此,我們簡略介紹直方圖、密度圖和箱線圖,這種三種圖形對我們來說更為常用。
很多人沒搞清楚條形圖和直方圖之間的區別。條形圖主要用於展示分類資料,即名義資料,各組分開而立。而直方圖多用於展示數值型資料,各組相依。
最基本的語句就是在ggplot語句後再加geom_histogram()即可。
直方圖預設最大為30組,我們可以使用*binwidth來改變。
ggplot(faithful, aes(x=waiting)) +geom_histogram(binwidth=8,
fill="white"
,colour="black"
)#改為8組
分組直方圖做法與其他圖形一樣,我們用到facet_grid(var ~ .),該方法是以var變數進行分類,做多個圖形,非乙個圖形中做多個直方圖。如果變數為數字,應當因子化。
library(mass) #取binwidth資料
如果你想要做密度曲線,則用geom_density對映一連續變數。
ggplot(faithful, aes(x=waiting)) + geom_density()
#你也可以將包住的部分給填充顏色
ggplot(faithful, aes(x=waiting)) +
geom_density(fill="blue", alpha=.2) +
xlim(35, 105)
ggplot(faithful, aes(x=waiting)) + geom_line(stat="density") +
expand_limits(y=0)
#expand_limits使y軸範圍包含0值。
#密度曲線與直方圖共戲
箱線圖應用十分廣泛,特別是在比較多組資料上。上**,看看如何實用。
ggplot(birthwt, aes(x=factor(race),
y=bwt)) + geom_boxplot()
#如果存在多個多個離群點,可用outlier.size 和outlier.shape進行大小和形狀設定
ggplot(birthwt, aes(x=factor(race),
y=bwt)) +
geom_boxplot(outlier.size=1.5,
outlier.shape=21)
#為了看資料分布是否有偏,我們還可以增加均值與中值進行比較,主要用stat_summary把均值以菱形相展示。
R正態分佈 ggplot
randnorm rnorm 3000 rnorm 3000 產生3000個正太分布數 randdensity dnorm randnorm dnorm randnorm 求其密度函式值 ggplot data.frame x randnorm,y randdensity aes x x,y y g...
R語言ggplot2包之注釋
光光展示資料對視覺化來說,遠遠不夠。還有其他很多資訊能夠幫助讀者解釋你的資料。除了標籤 座標軸 圖例外,還能夠增加注釋,比如強調圖畫的某一區域,新增描述性文字等。你可以在圖形中新增文字,增加可讀性。我們在annotate函式中設定text引數即可。library ggplot2 library gc...
R語言 ggplot語句總結
ggplot基礎語句 折線圖ggplot data,aes x y colour group geom line size 1 labs x y title 標題居中 theme plot.title element text hjust 0.5 柱形圖 ggplot data,aes x y 顯示...