R語言中平均值、中位數和模式知識點總結
R中的統計分析通過使用許多內置函數來執行。 這些函數大多數是R基礎包的一部分。 這些函數將R向量作為輸入和參數,並給出結果。
我們在本章中討論的功能是平均值,中位數和模式。
Mean平均值
通過求出數據集的和再除以求和數的總量得到平均值
函數mean()用於在R語言中計算平均值。
語法
用於計算R中的平均值的基本語法是
mean(x, trim = 0, na.rm = FALSE, ...)
以下是所使用的參數的描述
- x是輸入向量。
- trim用於從排序向量的兩端丟棄一些觀察結果。
- na.rm用於從輸入向量中刪除缺失值。
例
# Create a vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5) # Find Mean. result.mean <- mean(x) print(result.mean)
當我們執行上面的代碼,它產生以下結果
[1] 8.22
應用修剪選項
當提供trim參數時,向量中的值被排序,然後從計算平均值中減去所需的觀察值。
當trim = 0.3時,來自每端的3個值將從計算中減去以找到均值。
在這種情況下,排序的向量是(-21,-5,2,3,4.2,7,8,12,18,54),並且從用於計算平均值的向量中移除的值是(-21,-5,2) 從左邊和(12,18,54)從右邊。
# Create a vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5) # Find Mean. result.mean <- mean(x,trim = 0.3) print(result.mean)
當我們執行上面的代碼,它產生以下結果
[1] 5.55
應用NA選項
如果有缺失值,則平均函數返回NA。
要從計算中刪除缺少的值,請使用na.rm = TRUE。 這意味著去除NA值。
# Create a vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA) # Find mean. result.mean <- mean(x) print(result.mean) # Find mean dropping NA values. result.mean <- mean(x,na.rm = TRUE) print(result.mean)
當我們執行上面的代碼,它產生以下結果
[1] NA [1] 8.22
Median中位數
數據系列中的最中間值稱為中值。 在R語言中使用median()函數來計算此值。
語法
計算R語言中位數的基本語法是
median(x, na.rm = FALSE)
以下是所使用的參數的描述
- x是輸入向量。
- na.rm用於從輸入向量中刪除缺失值。
例
# Create the vector. x <- c(12,7,3,4.2,18,2,54,-21,8,-5) # Find the median. median.result <- median(x) print(median.result)
當我們執行上面的代碼,它產生以下結果
[1] 5.6
Mode模式
模式是一組數據中出現次數最多的值。 Unike平均值和中位數,模式可以同時包含數字和字符數據。
R語言沒有標準的內置函數來計算模式。 因此,我們創建一個用戶函數來計算R語言中的數據集的模式。該函數將向量作為輸入,並將模式值作為輸出。
例
# Create the function. getmode <- function(v) { uniqv <- unique(v) uniqv[which.max(tabulate(match(v, uniqv)))] } # Create the vector with numbers. v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3) # Calculate the mode using the user function. result <- getmode(v) print(result) # Create the vector with characters. charv <- c("o","it","the","it","it") # Calculate the mode using the user function. result <- getmode(charv) print(result)
當我們執行上面的代碼,它產生以下結果
[1] 2 [1] "it"
到此這篇關於R語言中平均值、中位數和模式知識點總結的文章就介紹到這瞭,更多相關R語言平均值,中位數和模式內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- R語言線性回歸知識點總結
- python sklearn與pandas實現缺失值數據預處理流程詳解
- R語言數據類型知識點總結
- R語言中的vector(向量),array(數組)使用總結
- Pandas中Series的屬性,方法,常用操作使用案例