r語言-如何將數據標準化和中心化

中心化和標準化意義一樣,都是消除量綱的影響

中心化:數據-均值

標準化:(數據-均值)/標準差

數據中心化: scale(data,center=T,scale=F)

數據標準化: scale(data,center=T,scale=T)

或默認參數scale(data)

scale方法中的兩個參數center和scale的解釋:

1.center和scale默認為真,即T或者TRUE

2.center為真表示數據中心化

3.scale為真表示數據標準化

補充:R語言對數據進行標準化處理

有時候,在分析數據時,需要對數據進行直線轉換,也就是將數據做標準化處理,標準化處理的結果稱為標準分數,標準化處理的轉換公式如下:

舉例說明:

首先,導入數據

其次,轉換成標準分數,並以向量形式輸出

最後,保留小數點位數

data<-read.table("clipboard",header=T)    #導入數據
A<-as.matrix(data[,2:4])                             #將數據框轉換為矩陣
colnames(A)<-NULL                                 #將數據框的第一行標題去掉
Z<-as.vector(scale(A))                            #轉換標準分數,以向量形式輸出
round(Z,4)                                             #結果保留4為小數點

根據以上,運行結果如下:

第一步:導入數據

第二步:將數據框轉換為矩陣形式

第三步:進行標準化處理

第四步:保留小數點為4位

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀:

    None Found