基於R語言賦值符號的區別說明
R語言賦值可以用=或<-,一般都建議使用<-,那你知道這兩個之間的區間嗎?那你有沒有見過‘<-‘和‘=’這種賦值方法嗎?今天就來和大傢聊聊這基本的賦值符號都有哪些區別。
首先我們來看看符號的優先級,和java,c這些編程語言的優先級類似。下面這些都取自R幫助文檔,輸入?Syntax即可查看,它是根據優先級從高到低排列的。
:: ::: access variables in a namespace $ @ component / slot extraction [ [[ indexing ^ exponentiation (right to left) - + unary minus and plus : sequence operator %any% special operators (including %% and %/%) * / multiply, divide + - (binary) add, subtract < > <= >= == != ordering and comparison ! negation & && and | || or ~ as in formulae -> ->> rightwards assignment <- <<- assignment (right to left) = assignment (right to left) ? help (unary and binary)
我們可以看到<-的優先級比=高,這一點我們在使用時一定要註意到。
現在來舉幾個簡單例子看看
> median(x =1:10) [1] 5.5> x 錯誤: 找不到對象'x' > median(x <-1:10) [1] 5.5 > x [1] 1 2 3 4 5 6 7 8 9 10
現在來看另外一個例子
> rm(x) > median((x=1:10)) [1] 5.5 > x [1] 1 2 3 4 5 6 7 8 9 10
那這又是為什麼不報錯瞭呢?那是因為括號的優先級更高,它相當於先給x賦值,再傳入到median,與下面例子等價。
> rm(x) > x=1:10 #此時等價於x<-1:10 > median(x) [1] 5.5 > x [1] 1 2 3 4 5 6 7 8 9 10
為什麼此時輸入x並沒有報錯而前面卻報錯?因為在這種情況下,x被定義在用戶的當前工作空間,所以在這個使用median之後x還是存在的。
總結一下:
這說明使用這兩種方法賦值的變量是存在不同的空間或作用域。= 賦值對象存在賦值時所在的空間,而<- 賦值對象存在當前整個空間。
看起來有點晦澀,現在來仔細說說這兩個的區別:
(1) 賦值時所在的空間,比如median(x =1:10),x的值僅存在median函數內部空間,在median函數外面訪問不到x,所以前面程序中報錯:錯誤: 找不到對象’x’。
(2) 當前整個空間,比如median(x <-1:10),它其實就是median(x=x <-1:10),<-優先級高,先執行x <-1:10,再賦值給x,隻不過這裡省略瞭,因為一般傳參數時,我們都不寫參數名。x存在於當前空間,所以x可以訪問到。
如果我們定義一個函數,函數中變量用<-賦值,那麼在函數外面還能訪問到嗎?
> rm(x) > test<-function(){ + x<-1 + } >test() > x
錯誤: 找不到對象’x’
當然是不能的,因為x定義在test函數內部,僅存在test函數的空間裡面,所以在該函數外面根本訪問不到x。如果想訪問到x,除瞭returen,也不是沒有其他辦法的。
現在來看看另外一種賦值方法,估計很少人見過,瞭解之後有助於我們理解賦值過程。
> '<-'(x,5) #等價於x<-5 > x [1] 5 > '='(x,6)#等價於x=6 > x [1] 6
簡單瞭解之後,來做幾個測試
一般情況下,將=和<-兩個賦值符號同時使用就會出現一些錯誤,比如下面這例子,如果瞭解'<-‘之後,那麼就很容易理解。
> x<-y<-10 #等價於'<-'(x,'<-'(y,10)) > x [1] 10 > y [1] 10 > x <- y = 12 Error in x <- y = 12 : 沒有"<-<-"這個函數 # 由於優先級的問題,它等價於'='('<-'(x,y),12),並不是'<-'(x,'='(y,12)) > x=y<-12 #不報錯,等價於 '='(x,'<-'(y,12))
這裡主要是因為優先級的問題,<-的優先級高於=。
為瞭說明什麼時候用這兩種賦值方法,先隨便看一個函數,比如scan函數,我們可以發現傳遞參數用的都是=,因此傳參數基本都是用=而不是<-。
scan(file = "", what = double(), nmax = -1, n = -1, sep = "", quote = if(identical(sep, "\n")) "" else "'\"", dec = ".", skip = 0, nlines = 0, na.strings = "NA", flush = FALSE, fill = FALSE, strip.white = FALSE, quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE, comment.char = "", allowEscapes = FALSE, fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
在R文檔中有下面介紹(?assignOps ):文檔中介紹說<-可以用在任何地方,而=隻能用在優先級高的地方,比如說表達式中或子表達式。
The operator <- can be used anywhere, whereas the operator = is only allowed at the
top level (e.g., in the complete expression typed at the command prompt) or as one
of the subexpressions in a braced list of expressions.
我覺得<-多用於賦值,而=更多用於傳值,它們之間優先級不同,賦值對象作用域不同。在使用的時候,隻要註意到變量工作的空間(作用域)以及符號之間的優先級,一般是不會出錯的。
補充:R語言賦值語句<-, <<-, =, %>%有什麼區別?
<-和->是一對,可以向左和向右賦值;
=是單向的,作用和<-基本相同,但對函數中的變量通常使用=;
<<-這個是全局賦值,跟變量的作用域有關,一般不會用到
%>%:來自dplyr包的管道函數,其作用是將前一步的結果直接傳參給下一步的函數,並作為右件表達式函數的第一個參數(或剩下唯一一個選項的設置),從而省略瞭中間的賦值步驟,可以大量減少內存中的對象,節省內存。
anscombe_tidy <- anscombe %>%mutate(observation = seq_len(n()))
以上代碼等價於
anscombe_tidy=mutate(anscombe,observation = seq_len(n()))
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- None Found