R語言實現線性回歸的示例

在統計學中,線性回歸(Linear Regression)是利用稱為線性回歸方程的最小平方函數對一個或多個自變量和因變量之間關系進行建模的一種回歸分析。

簡單對來說就是用來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法。

回歸分析中,隻包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關系,則稱為多元線性回歸分析。

一元線性回歸分析法的數學方程:

y = ax + b
  • y 是因變量的值。
  • x 是自變量的值。
  • a 與 b 為一元線性回歸方程的參數。

接下來我們可以創建一個人體身高與體重的預測模型:

1、收集樣本數據:身高與體重。
2、使用 lm() 函數來創建一個關系模型。
3、從創建的模型中找到系數,並創建數學方程式。
4、獲取關系模型的概要,瞭解平均誤差即殘差(估計值與真實值之差)。
5、使用 predict() 函數來預測人的體重。

準備數據

以下是人的身高與體重數據:

# 身高,單位 cm
151, 174, 138, 186, 128, 136, 179, 163, 152, 131

# 體重,單位 kg
63, 81, 56, 91, 47, 57, 76, 72, 62, 48

lm() 函數

在 R 中,你可以通過函數 lm() 進行線性回歸。

lm() 函數用於創建自變量與因變量之間的關系模型。

lm() 函數語法格式如下:

lm(formula,data)

參數說明:

  • formula – 一個符號公式,表示 x 和 y 之間的關系。
  • data – 應用數據。

創建關系模型,並獲取系數:

# 樣本數據
x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)

# 提交給 lm() 函數
relation <- lm(y~x)

print(relation)

執行以上代碼輸出結果為:

Call:
lm(formula = y ~ x)

Coefficients:
(Intercept)      x 
  -38.4551    0.6746 

使用 summary() 函數獲取關系模型的概要:

x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)

# 提交給 lm() 函數
relation <- lm(y~x)

print(summary(relation))

執行以上代碼輸出結果為:

Call:
lm(formula = y ~ x)

Residuals:
  Min   1Q   Median   3Q   Max 
-6.3002  -1.6629 0.0412  1.8944 3.9775 

Coefficients:
       Estimate Std. Error t value Pr(>|t|)  
(Intercept) -38.45509  8.04901 -4.778 0.00139 ** 
x       0.67461  0.05191 12.997 1.16e-06 ***
---
Signif. codes: 0 ‘***' 0.001 ‘**' 0.01 ‘*' 0.05 ‘.' 0.1 ‘ ' 1

Residual standard error: 3.253 on 8 degrees of freedom
Multiple R-squared: 0.9548,  Adjusted R-squared: 0.9491 
F-statistic: 168.9 on 1 and 8 DF, p-value: 1.164e-06

predict() 函數

predict() 函數用於根據我們建立的模型來預測數值。

predict() 函數語法格式如下:

predict(object, newdata)

參數說明:

  • object – lm() 函數創建的公式。
  • newdata – 要預測的值。

以下實例我們預測一個新的體重值:

# 樣本數據
x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)

# 提交給 lm() 函數
relation <- lm(y~x)

# 判斷身高為 170cm 的體重
a <- data.frame(x = 170)
result <-  predict(relation,a)
print(result)

執行以上代碼輸出結果為:

1 
76.22869 

我們也可以生存一個圖表:

# 樣本數據
x <- c(151, 174, 138, 186, 128, 136, 179, 163, 152, 131)
y <- c(63, 81, 56, 91, 47, 57, 76, 72, 62, 48)
relation <- lm(y~x)

# 生存 png 圖片
png(file = "linearregression.png")

# 生成圖表
plot(y,x,col = "blue",main = "Height & Weight Regression",
abline(lm(x~y)),cex = 1.3,pch = 16,xlab = "Weight in Kg",ylab = "Height in cm")

圖表如下:

以上就是R語言實現線性回歸的示例的詳細內容,更多關於R語言 線性回歸的資料請關註WalkonNet其它相關文章!

推薦閱讀: