R語言數據框中的負索引介紹
以R語言自帶的mtcars數據框為例:
這是原始的mtcars數據:
這裡隻列出瞭前面幾行數據。
然後負索引mtcars[,-2:-3],得到的結果
刪除瞭第二列和第三列數據
所以R語言數據框中的負索引是指刪除數據框中對應的列(或者行)
ps:這和Python裡面的規則好像不太一樣,Python裡的負索引好像是指倒數第幾列(或者第幾行),這裡這兩個軟件區別還挺大的~~寫個筆記提醒一下自己~
補充:R語言中的負整數索引
看代碼吧~
> x<-matrix(c(1,2,3,4,5,6,7,8,9),nrow = 3,ncol = 3,byrow = TRUE) > x [,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 [3,] 7 8 9 > x[-1,] [,1] [,2] [,3] [1,] 4 5 6 [2,] 7 8 9
這在R中稱為負整數索引向量,這種索引向量指定被排除的元素而不是包括進來,因此x[-1,]表示取出矩陣x的除瞭第一行元素外的其他元素。
補充:R語言-基本語法、數據類型及索引
1. 基本語法
print()
、cat()
打印輸出
#
單行註釋
if(FALSE){code block}
多行註釋
2. 數據類型
class():查看數據類型
2.1 基本數據類型
基本數據類型 | 示例 |
---|---|
邏輯值(logical) | 真:TRUE、T,假:FALSE、F |
數字(numeric) | 123、5 |
整型(integer) | 2L、34L |
復數(complex) | 3+2i |
字符(character) | ‘good’ |
2.2 向量Vector
c()函數創建向量。
註意:必須保證元素類型相同,否則會默認進行類型轉換。
> x <- c(1, 2) > class(x) [1] "numeric" > x <- c('s') > class(x) [1] "character" > x <- c(1, 2, 's') > class(x) [1] "character"
2.3 列表List
列表可以包含許多不同類型的元素,如向量、函數、嵌套列表。
註意:[]與[[]]的區別。[]取出來的仍是一個列表,[[]]取出來的是本身的數據類型。
> list1 <- list(c(2,3), 21, 's', sin) # 分別包含列表、數字、字符、函數 > class(list1) [1] "list" > list1[1] # 取出來的仍是一個列表 [[1]] [1] 2 3 > list1[[1]] # 取出來的是子列表中的元素 [1] 2 3 > class(list1[1]) [1] "list" > class(list1[[1]]) [1] "numeric" > list1[[2]] [1] 21 > list1[2] + 2 Error in list1[2] + 2 : non-numeric argument to binary operator > list1[[2]] + 2 [1] 23 > list1[[4]] function (x) .Primitive("sin") > class(list1[[4]]) [1] "function"
2.4 矩陣Matrix
矩陣是二維數據集,它可以使用矩陣函數的向量輸入創建。
byrow參數決定元素存放的順序。
> M <- matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE) > M [,1] [,2] [,3] [1,] "a" "a" "b" [2,] "c" "b" "a" > M[,1] # 取出第一列數據 [1] "a" "c" > M[1,] # 取出第一行數據 [1] "a" "a" "b" > M[2,1] # 取出單個元素 [1] "c"
2.5 數組Array
利用數組可以創建任意維度的數據。
> array1 <- array(c('green','yellow'), dim=c(3,3,2)) > array1 , , 1 [,1] [,2] [,3] [1,] "green" "yellow" "green" [2,] "yellow" "green" "yellow" [3,] "green" "yellow" "green" , , 2 [,1] [,2] [,3] [1,] "yellow" "green" "yellow" [2,] "green" "yellow" "green" [3,] "yellow" "green" "yellow"
2.6 因子Factor
因子是使用向量創建的對象。它將向量與向量中元素的不同值一起存儲為標簽。 標簽是字符類型。 它們在統計建模中非常有用。
使用factor()函數創建因子。nlevels函數給出級別計數。
> apple_colors <- c('green','green','yellow','red','red','red','green') > factor_apple <- factor(apple_colors) > factor_apple [1] green green yellow red red red green Levels: green red yellow > nlevels(factor_apple) [1] 3
2.7 數據框Data Frame
表格數據對象。每列可以包含不同的數據類型。 第一列可以是數字,而第二列可以是字符,第三列可以是邏輯的。 它是等長度的向量的列表。
使用data.frame()函數創建數據框。
# 創建數據框,表格對象 > BMI <- data.frame( gender = c("Male", "Male","Female"), height = c(152, 171.5, 165), weight = c(81,93, 78), Age = c(42,38,26) ) > BMI gender height weight Age 1 Male 152.0 81 42 2 Male 171.5 93 38 3 Female 165.0 78 26 # 獲取第二列 > BMI[2] height 1 152.0 2 171.5 3 165.0 # 獲取第一行 > BMI[1,] gender height weight Age 1 Male 152 81 42 # 獲取第一列數據,類型為DataFrame > BMI[1] gender 1 Male 2 Male 3 Female > class(BMI[1]) [1] "data.frame" # 獲取第一列,並將其轉換為factor類型 > BMI[,1] [1] Male Male Female Levels: Female Male # 獲取第一個元素,轉換為factor類型 > BMI[1,1] [1] Male Levels: Female Male # 獲取第二列,不改變數據類型 > BMI[2] height 1 152.0 2 171.5 3 165.0 # 獲取第二列,改變數據類型 > BMI[,2] [1] 152.0 171.5 165.0 # 根據列的名稱獲取factor類型數據 data_frame$col_name
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- None Found