R語言ggplot包之資料分布彙總

2021-07-03 23:02:42 字數 2806 閱讀 1180

我們經常想觀察一批資料的分布形態,直方圖、密度圖、箱線圖、小提琴圖和點圖等都是很好的實現形式。在此,我們簡略介紹直方圖、密度圖和箱線圖,這種三種圖形對我們來說更為常用。

很多人沒搞清楚條形圖和直方圖之間的區別。條形圖主要用於展示分類資料,即名義資料,各組分開而立。而直方圖多用於展示數值型資料,各組相依。

最基本的語句就是在ggplot語句後再加geom_histogram()即可。

直方圖預設最大為30組,我們可以使用*binwidth來改變。

ggplot(faithful, aes(x=waiting)) +geom_histogram(binwidth=8,

fill="white"

,colour="black"

)#改為8組

分組直方圖做法與其他圖形一樣,我們用到facet_grid(var ~ .),該方法是以var變數進行分類,做多個圖形,非乙個圖形中做多個直方圖。如果變數為數字,應當因子化。

library(mass) #取binwidth資料

如果你想要做密度曲線,則用geom_density對映一連續變數。

ggplot(faithful, aes(x=waiting)) + geom_density()

#你也可以將包住的部分給填充顏色

ggplot(faithful, aes(x=waiting)) +

geom_density(fill="blue", alpha=.2) +

xlim(35, 105)

ggplot(faithful, aes(x=waiting)) + geom_line(stat="density") +

expand_limits(y=0)

#expand_limits使y軸範圍包含0值。

#密度曲線與直方圖共戲

箱線圖應用十分廣泛,特別是在比較多組資料上。上**,看看如何實用。

ggplot(birthwt, aes(x=factor(race),

y=bwt)) + geom_boxplot()

#如果存在多個多個離群點,可用outlier.size 和outlier.shape進行大小和形狀設定

ggplot(birthwt, aes(x=factor(race),

y=bwt)) +

geom_boxplot(outlier.size=1.5,

outlier.shape=21)

#為了看資料分布是否有偏,我們還可以增加均值與中值進行比較,主要用stat_summary把均值以菱形相展示。

R正態分佈 ggplot

randnorm rnorm 3000 rnorm 3000 產生3000個正太分布數 randdensity dnorm randnorm dnorm randnorm 求其密度函式值 ggplot data.frame x randnorm,y randdensity aes x x,y y g...

R語言ggplot2包之注釋

光光展示資料對視覺化來說,遠遠不夠。還有其他很多資訊能夠幫助讀者解釋你的資料。除了標籤 座標軸 圖例外,還能夠增加注釋,比如強調圖畫的某一區域,新增描述性文字等。你可以在圖形中新增文字,增加可讀性。我們在annotate函式中設定text引數即可。library ggplot2 library gc...

R語言 ggplot語句總結

ggplot基礎語句 折線圖ggplot data,aes x y colour group geom line size 1 labs x y title 標題居中 theme plot.title element text hjust 0.5 柱形圖 ggplot data,aes x y 顯示...