R語言 如何獲取指定位置的數據
R語言-獲取指定位置的數據
R中采用數據對象+[ , ]的方式獲取對應位置的數據,根據填入索引參數的不同類型可具體分為:
正整數、負整數、零、空格、邏輯值、名稱
> matrix [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 2 6 10 14 18 [3,] 3 7 11 15 19 [4,] 4 8 12 16 20
1.正整數索引
因為R中的起始位置為1,與一般的編程語言不同,所以這類索引最為常見。
需要註意的是,如果索引中存在重復值,R會繼續執行進而重復提取部分值,如:
> matrix[c(1,1),1:5] [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 1 5 9 13 17
2.負整數索引
使用負整數索引與正整數正好相反,R會返回不包含在負整數對應位置的元素,當需要選取的行或列很多時,用這個索引會更快捷。
需要註意,正整數索引與負整數索引可以同時出現在不同索引位置,但不能同時出現在同一位置,否則將報錯,具體如下:
> matrix[c(-1,-1),1] [1] 2 3 4 > matrix[c(-1,1),1] Error in matrix[c(-1, 1), 1] : only 0's may be mixed with negative subscripts
3.零索引
零索引的存在說實話並沒有什麼意義,很有可能是設計師為瞭防止很多程序員無法避開從0開始計數而經常導致error的一種保護措施而已。使用情況如下:
> matrix[1,0] integer(0) > matrix[0,0] <0 x 0 matrix>
4.空格索引
空格表示提取該索引位置所對應的所有維度,但不寫空格效果也一樣,具體如下:
> matrix[1,] [1] 1 5 9 13 17 > matrix[1, ] [1] 1 5 9 13 17
5.邏輯值索引
當提供的索引位置是一個包含TRUE和FALSE邏輯值的向量,那麼R會匹配出索引值為TRUE的列,並取出相應元素。
使用這種方法,需要向量長度與索引位置的維度相同,否則就達不到需要的效果,具體如下:
> matrix[c(T,F,F,F),] [1] 1 5 9 13 17
這種方式看似笨重,但在特殊情況下作用十分明顯
6.名稱索引
當被索引的對象有名稱屬性,就可以采用名稱作為索引提取相關元素,這是提取列的常用方法,因為列總會有名稱,具體如下:
> colnames(matrix)<-c("a","b","c","d","e") > matrix[,"b"] [1] 5 6 7 8
補充:R語言獲取特定時間段的數據
獲取特定時間段的表格數據方法:
1. 方法一:正則表達式
data <- read.csv('F:/data.csv') date <- as.Date(data$Date) #獲取2018-3-1到2018-3-10之間的第3-5列數據 subT <- date[(format(date,format = "%Y")=="2018"&as.numeric(format(date,format = "%m"))=="3" &as.numeric(format(date,format = "%d"))>=1&as.numeric(format(date,format = "%d"))<=10),3:5] #對2018-3-1到2018-3-10之間第3-5列的數據進行按列求平均值 mean <- apply(subT,2, mean)
2. 方法二:
date1 <- as.POSIXct(paste("2018-3-1","08:00:00")) date2 <- as.POSIXct(paste("2018-3-1","17:00:00")) int <- interval(date1, date2) #獲取2018-3-1 08:00:00到2018-3-1 17:00:00之間的第3-5列數據 subT <- data[ymd_hms(data$Date) %within% int,3:5]
註意:
1. within判斷數據是否在該時間段之內,其中包括起始時間,不包括末尾時間。
2.paste0(num_year[y],’_’,m,’_1′) 實現字符串的合並,其中m,num_year[y]為變量。
paste拼接時有空格,paste0無空格
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- None Found