R語言多元線性回歸實例詳解

一、模型簡介

一元線性回歸是一個主要影響因素作為自變量來解釋因變量的變化,在現實問題研究中,因變量的變化往往受幾個重要因素的影響,此時就需要用兩個或兩個以上的影響因素作為自變量來解釋因變量的變化,這就是多元回歸亦稱多重回歸。當多個自變量與因變量之間是線性關系時,所進行的回歸分析就是多元線性回歸。

二、求解過程

這裡我使用的數據是包裡面自帶的數據,我們導入並進行查看:

可以看到第一列是我們的數據標簽(無數學含義),後面五列分別為對應的五個特征即相應的數值。我的任務是使用後四個變量來擬合第一個變量"Murder"

在進行多元線性回歸之前,通常需要對變量進行相關性分析,例如:我們想用x, y 兩個變量來擬合變量 z, 如果x, y相關性過強,則我們隻需要其中一個變量就可以擬合z,這就是我們學的多重共線性。因此,我使用 cor 函數查看相關性,如下圖所示:

由於相關性矩陣並不直觀,因此我使用散點矩陣圖來可視化此關系,R語言代碼及可視化結果如下(其中我使用瞭smoother平滑方法):

下面使用 lm 函數進行多元線性回歸,代碼及運行截圖如下:

可以發現運行結果中有兩個變量被打瞭 “”, 分別為"Population" 和 “Illiteracy”,其中""越多表示越顯著,即 p 值越小,R-squared為0.567,效果不是特別理想,說明可能存在多重共線性或者變量間存在交互作用,接下來我使用mtcars數據集來進行實現(在R語言中使用冒號表示將兩個因變量交互):

然後我是用plot函數對多個參數進行可視化,代碼及運行截圖如下:

可見,wt越大,mpg和hp的線性關系越來越小(在上例中),因此我們可以認為設定多個值,尋找最佳的擬合方程。

總結

到此這篇關於R語言多元線性回歸的文章就介紹到這瞭,更多相關R語言多元線性回歸內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: