R語言中R-squared與Adjust R-squared參數的解釋

前言

最近做項目時,使用 R語言對一些數據做回歸計算,分析數據時,想查看這堆數據的相關性,得知R-squared可以得到我想要的信息,但是在打印線性關系式時,看到瞭R-squared,Adjust R-squared 這兩個參數,有點疑惑,上網也查看瞭一部分資料,最後,發現有兩道題可以很明白解釋這兩個參數,如下:

題一

如果在線性回歸模型中增加一個特征變量,下列可能發生的是(多選)?

A. R-squared 增大,Adjust R-squared 增大

B. R-squared 增大,Adjust R-squared 減小

C. R-squared 減小,Adjust R-squared 減小

D. R-squared 減小,Adjust R-squared 增大

答案:AB

**解析:**線性回歸問題中,R-Squared 是用來衡量回歸方程與真實樣本輸出之間的相似程度。其表達式如下所示

上式中,分子部分表示真實值與預測值的平方差之和,類似於均方差 MSE;分母部分表示真實值與均值的平方差之和,類似於方差 Var。一般來說,R-Squared 越大,表示模型擬合效果越好。R-Squared 反映的是大概有多準,因為,隨著樣本數量的增加,R-Squared 必然增加,無法真正定量說明準確程度,隻能大概定量。

單獨看 R-Squared,並不能推斷出增加的特征是否有意義。通常來說,增加一個特征特征,R-Squared 可能變大也可能保持不變,兩者不一定呈正相關。

如果使用校正決定系數(Adjusted R-Squared):

其中,n 是樣本數量,p 是特征數量。Adjusted R-Squared 抵消樣本數量對 R-Squared 的影響,做到瞭真正的 0~1,越大越好。

增加一個特征變量,如果這個特征有意義,Adjusted R-Square 就會增大,若這個特征是冗餘特征,Adjusted R-Squared 就會減小。

題二

在一個線性回歸問題中,我們使用 R 平方(R-Squared)來判斷擬合度。此時,如果增加一個特征,模型不變,則下面說法正確的是?

A. 如果 R-Squared 增加,則這個特征有意義

B. 如果R-Squared 減小,則這個特征沒有意義

C. 僅看 R-Squared 單一變量,無法確定這個特征是否有意義。

D. 以上說法都不對

答案:C

解析: 看題一解析

總結

到此這篇關於R語言中R-squared與Adjust R-squared參數解釋的文章就介紹到這瞭,更多相關R語言 R-squared與Adjust R-squared內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: