基於R語言賦值符號的區別說明

Posted on 2021-04-22 by WalkonNet

R語言賦值可以用=或<-，一般都建議使用<-，那你知道這兩個之間的區間嗎？那你有沒有見過‘<-‘和‘=’這種賦值方法嗎？今天就來和大傢聊聊這基本的賦值符號都有哪些區別。

首先我們來看看符號的優先級，和java,c這些編程語言的優先級類似。下面這些都取自R幫助文檔，輸入?Syntax即可查看，它是根據優先級從高到低排列的。

:: :::    access variables in a namespace
$ @    component / slot extraction
[ [[    indexing
^    exponentiation (right to left)
- +    unary minus and plus
:    sequence operator
%any%    special operators (including %% and %/%)
* /    multiply, divide
+ -    (binary) add, subtract
< > <= >= == !=    ordering and comparison
!    negation
& &&    and
| ||    or
~    as in formulae
-> ->>    rightwards assignment
<- <<-    assignment (right to left)
=    assignment (right to left)
?    help (unary and binary)

我們可以看到<-的優先級比=高，這一點我們在使用時一定要註意到。

現在來舉幾個簡單例子看看

> median(x =1:10)
[1] 5.5> x
錯誤: 找不到對象'x'
> median(x <-1:10)
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

現在來看另外一個例子

> rm(x)
> median((x=1:10))
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

那這又是為什麼不報錯瞭呢？那是因為括號的優先級更高，它相當於先給x賦值，再傳入到median，與下面例子等價。

> rm(x)
> x=1:10 #此時等價於x<-1:10
> median(x)
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

為什麼此時輸入x並沒有報錯而前面卻報錯？因為在這種情況下，x被定義在用戶的當前工作空間，所以在這個使用median之後x還是存在的。

總結一下：

這說明使用這兩種方法賦值的變量是存在不同的空間或作用域。= 賦值對象存在賦值時所在的空間，而<- 賦值對象存在當前整個空間。

看起來有點晦澀，現在來仔細說說這兩個的區別：

(1) 賦值時所在的空間，比如median(x =1:10)，x的值僅存在median函數內部空間，在median函數外面訪問不到x，所以前面程序中報錯：錯誤: 找不到對象’x’。

(2) 當前整個空間，比如median(x <-1:10)，它其實就是median(x=x <-1:10)，<-優先級高，先執行x <-1:10，再賦值給x，隻不過這裡省略瞭，因為一般傳參數時，我們都不寫參數名。x存在於當前空間，所以x可以訪問到。

如果我們定義一個函數，函數中變量用<-賦值，那麼在函數外面還能訪問到嗎？

> rm(x)
> test<-function(){
+ x<-1
+ }
>test()
> x

錯誤: 找不到對象’x’

當然是不能的，因為x定義在test函數內部，僅存在test函數的空間裡面，所以在該函數外面根本訪問不到x。如果想訪問到x，除瞭returen,也不是沒有其他辦法的。

現在來看看另外一種賦值方法，估計很少人見過，瞭解之後有助於我們理解賦值過程。

> '<-'(x,5) #等價於x<-5
> x
[1] 5
> '='(x,6)#等價於x=6
> x
[1] 6

簡單瞭解之後，來做幾個測試

一般情況下，將=和<-兩個賦值符號同時使用就會出現一些錯誤，比如下面這例子，如果瞭解'<-‘之後，那麼就很容易理解。

> x<-y<-10 #等價於'<-'(x,'<-'(y,10))
> x
[1] 10
> y
[1] 10
> x <- y = 12
Error in x <- y = 12 : 沒有"<-<-"這個函數
# 由於優先級的問題，它等價於'='('<-'(x,y),12),並不是'<-'(x,'='(y,12))
> x=y<-12 #不報錯，等價於 '='(x,'<-'(y,12))

這裡主要是因為優先級的問題，<-的優先級高於=。

為瞭說明什麼時候用這兩種賦值方法，先隨便看一個函數，比如scan函數，我們可以發現傳遞參數用的都是=，因此傳參數基本都是用=而不是<-。

scan(file = "", what = double(), nmax = -1, n = -1, sep = "",
     quote = if(identical(sep, "\n")) "" else "'\"", dec = ".",
     skip = 0, nlines = 0, na.strings = "NA",
     flush = FALSE, fill = FALSE, strip.white = FALSE,
     quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,
     comment.char = "", allowEscapes = FALSE,
     fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

在R文檔中有下面介紹（?assignOps ）：文檔中介紹說<-可以用在任何地方，而=隻能用在優先級高的地方，比如說表達式中或子表達式。

The operator <- can be used anywhere, whereas the operator = is only allowed at the

top level (e.g., in the complete expression typed at the command prompt) or as one

of the subexpressions in a braced list of expressions.

我覺得<-多用於賦值，而=更多用於傳值，它們之間優先級不同，賦值對象作用域不同。在使用的時候，隻要註意到變量工作的空間（作用域）以及符號之間的優先級，一般是不會出錯的。

補充：R語言賦值語句<-, <<-, =, ％>％有什麼區別？

<-和->是一對，可以向左和向右賦值；

=是單向的，作用和<-基本相同，但對函數中的變量通常使用=；

<<-這個是全局賦值，跟變量的作用域有關，一般不會用到

％>％：來自dplyr包的管道函數，其作用是將前一步的結果直接傳參給下一步的函數，並作為右件表達式函數的第一個參數（或剩下唯一一個選項的設置），從而省略瞭中間的賦值步驟，可以大量減少內存中的對象，節省內存。

anscombe_tidy <- anscombe %>%mutate(observation = seq_len(n()))

以上代碼等價於

anscombe_tidy=mutate(anscombe,observation = seq_len(n()))

以上為個人經驗，希望能給大傢一個參考，也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方，望不吝賜教。

基於R語言賦值符號的區別說明

現在來舉幾個簡單例子看看

現在來看另外一個例子

總結一下：

看起來有點晦澀，現在來仔細說說這兩個的區別：

簡單瞭解之後，來做幾個測試

推薦閱讀：

發佈留言取消回覆

近期文章

現在來舉幾個簡單例子看看

現在來看另外一個例子

總結一下：

看起來有點晦澀，現在來仔細說說這兩個的區別：

簡單瞭解之後，來做幾個測試

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆