r語言-如何將數據標準化和中心化
中心化和標準化意義一樣,都是消除量綱的影響
中心化:數據-均值
標準化:(數據-均值)/標準差
數據中心化: scale(data,center=T,scale=F)
數據標準化: scale(data,center=T,scale=T)
或默認參數scale(data)
scale方法中的兩個參數center和scale的解釋:
1.center和scale默認為真,即T或者TRUE
2.center為真表示數據中心化
3.scale為真表示數據標準化
補充:R語言對數據進行標準化處理
有時候,在分析數據時,需要對數據進行直線轉換,也就是將數據做標準化處理,標準化處理的結果稱為標準分數,標準化處理的轉換公式如下:
舉例說明:
首先,導入數據
其次,轉換成標準分數,並以向量形式輸出
最後,保留小數點位數
data<-read.table("clipboard",header=T) #導入數據 A<-as.matrix(data[,2:4]) #將數據框轉換為矩陣 colnames(A)<-NULL #將數據框的第一行標題去掉 Z<-as.vector(scale(A)) #轉換標準分數,以向量形式輸出 round(Z,4) #結果保留4為小數點
根據以上,運行結果如下:
第一步:導入數據
第二步:將數據框轉換為矩陣形式
第三步:進行標準化處理
第四步:保留小數點為4位
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- None Found