詳解R語言數據合並一行代碼搞定

數據的合並

需要的函數

cbind(),rbind(),bind_rows(),merge()

準備數據

我們先構造一組數據,以便下面的演示

> data1<-data.frame(
+  namea=c("海波","立波","秀波"),
+  value=c("一波","接","一波")
+ )
> data1
 namea value
1 海波 一波
2 立波  接
3 秀波 一波
> data2<-data.frame(
+  nameb=c("柯震東","劉強東","何盛東"),
+  value=c("東去","又","東來")
+ )
> data2
  nameb value
1 柯震東 東去
2 劉強東  又
3 何盛東 東來

按列合並

> cbind(data1,data2)
 namea value nameb value
1 海波 一波 柯震東 東去
2 立波  接 劉強東  又
3 秀波 一波 何盛東 東來

按行合並

按列合並是cbind(),那麼按行合並自然是rbind()

> rbind(data1,data2)
Error in match.names(clabs, names(xi)) : 名字同原來已有的名字不相對

出現瞭錯誤,這是因為”namea“ 和”nameb“不同造成的,如果都為”namea” :

> data1<-data.frame(
+  namea=c("海波","立波","秀波"),
+  value=c("一波","接","一波")
+ )
> data1
 namea value
1 海波 一波
2 立波  接
3 秀波 一波
> data2<-data.frame(
+  namea=c("柯震東","劉強東","何盛東"),
+  value=c("東去","又","東來")
+ )
> data2
  namea value
1 柯震東 東去
2 劉強東  又
3 何盛東 東來
> #cbind(data1,data2)
> rbind(data1,data2)
  namea value
1  海波 一波
2  立波  接
3  秀波 一波
4 柯震東 東去
5 劉強東  又
6 何盛東 東來

對數據修改後,沒有出現錯誤。如果 不修改數據該怎麼做:

​ 為瞭解決這個問題,使用dplyr包中的bind_rows()函數,不要求合並字段的名稱必須相同,這個函數會自己做判斷。

> library(dplyr)
> dplyr::bind_rows(data1,data2)
 namea value nameb
1 海波 一波  <NA>
2 立波  接  <NA>
3 秀波 一波  <NA>
4 <NA> 東去 柯震東
5 <NA>  又 劉強東
6 <NA> 東來 何盛東

merge()

merge(x, y, by = intersect(names(x), names(y)),
   by.x = by, by.y = by, all = FALSE, 
   all.x = all, all.y = all,
   sort = TRUE, suffixes = c(".x",".y"),
   incomparables = NULL, ...)

merge函數參數的說明:

  • x,y:用於合並的兩個數據框
  • by,by.x,by.y:指定依據哪些行合並數據框,默認值為相同列名的列.
  • all,all.x,all.y:指定x和y的行是否應該全在輸出文件.
  • sort:by指定的列是否要排序.
  • suffixes:指定除by外相同列名的後綴.
  • incomparables:指定by中哪些單元不進行合並.

演示merge()

data3<-data.frame(
 name = c("波","東","波","波"),
 type = c("秀","震","秀","秀"),
 class = c(10,5,4,11),
 num = c(85,50,90,90)
);data3
data4<-data_frame(
 name = c("波","東"),
 type = c("海","震"),
 class = c(5,5),
 num = c(88,81)
);data4
#合並data3和data4
> merge(data3,data4,all =T)
 name type class num
1  波  秀   4 90
2  波  秀  10 85
3  波  秀  11 90
4  波  海   5 88
5  東  震   5 50
6  東  震   5 81
#按照name,type,class合並data3.data4
> merge(data3, data4, by =c("name","type","class") , all = T)
 name type class num.x num.y
1  波  秀   4  90  NA
2  波  秀  10  85  NA
3  波  秀  11  90  NA
4  波  海   5  NA  88
5  東  震   5  50  81

到此這篇關於詳解R語言數據合並一行代碼搞定的文章就介紹到這瞭,更多相關R語言數據合並內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: