R語言繪制頻率直方圖的案例
頻率直方圖是數據統計中經常會用到的圖形展示方式,同時在生物學分析中可以更好的展示表型性狀的數據分佈類型;R基礎做圖中的hist函數對單一數據的展示很方便,但是當遇到多組數據的時候就不如ggplot2繪制來的方便。
***
1.基礎做圖hist函數
hist(rnorm(200),col='blue',border='yellow',main='',xlab='')
1.1 多圖展示
par(mfrow=c(2,3)) for (i in 1:6) {hist(rnorm(200),border='yellow',col='blue',main='',xlab='')}
2.ggplot2繪制
構造一組正態分佈的數據
PH<-data.frame(rnorm(300,75,5)) names(PH)<-c('PH') #顯示數據 head(PH) ## PH ## 1 72.64837 ## 2 67.10888 ## 3 89.34927 ## 4 75.70969 ## 6 82.85354
加載ggplot2作圖包並繪圖
library(ggplot2) library(gridExtra) p1<-ggplot(data=PH,aes(PH)) geom_histogram(color='white',fill='gray60') #控制顏色 ylab(label = 'total number') #修改Y軸標簽
2.1 修改柱子之間的距離
p2<-ggplot(data=PH,aes(PH)) geom_histogram(color='white',fill='gray60',binwidth = 3)
2.2 添加擬合曲線
p3<-ggplot(data=PH,aes(PH,..density..)) geom_histogram(color='white',fill='gray60',binwidth = 3) geom_line(stat='density')
2.3 修改線條的粗細
p4<-ggplot(data=PH,aes(PH,..density..)) geom_histogram(color='white',fill='gray60',binwidth = 3) geom_line(stat='density',size=1.5) grid.arrange(p1,p2,p3,p4)
2.4 繪制密度曲線
p1<-ggplot(data=PH,aes(PH,..density..)) geom_density(size=1.5)
2.5 修改線條樣式
p2<-ggplot(data=PH,aes(PH,..density..)) geom_density(size=1.5,linetype=2) p3<-ggplot(data=PH,aes(PH,..density..)) geom_density(size=1.5,linetype=5)
2.6 修改顏色
p4<-ggplot(data=PH,aes(PH,..density..)) geom_density(size=1.5,linetype=2,colour='red') grid.arrange(p1,p2,p3,p4)
2.7 多組數據展示
構造兩組數據
df<-data.frame(c(rnorm(200,5000,200),rnorm(200,5000,600)),rep(c('BJ','TJ'),each=200)) names(df)<-c('salary','city')
結果展示
library(ggplot2) p1<-ggplot() geom_histogram(data=df,aes(salary,..density..,fill=city),color='white') p2<-ggplot() geom_histogram(data=df,aes(salary,..density..,fill=city),color='white',alpha=.5) p3<-ggplot() geom_density(data=df,aes(salary,..density..,color=city)) p4<-ggplot() geom_histogram(data=df,aes(salary,..density..,fill=city),color='white') geom_density(data=df,aes(salary,..density..,color=city)) grid.arrange(p1,p2,p3,p4)
補充:R語言在直方圖上添加正太曲線與核密度曲線
lines(x=橫坐標向量,y=縱坐標向量),在已有圖像上添加曲線
hist(數值型向量,freq=TRUE/FALSE)freq取TRUE縱坐標為頻數,否則為頻率
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- R語言數據可視化tidyr與ggplot2多個變量分層展示舉例實現
- R語言學習ggplot2繪制統計圖形包全面詳解
- R語言作圖之density plot(密度圖)的制作步驟
- R語言數據可視化ggplot繪制置信區間與分組繪圖技巧
- R語言histogram(直方圖)的具體使用