Go語言開發必知的一個內存模型細節

引言

在日常工作中,如果我們能夠瞭解 Go 語言內存模型,那會帶來非常大的作用。這樣在看一些極端情況,又或是變態面試題的時候,就能夠明白程序運行表現下的很多根本原因瞭。

當然,靠一篇普通文章講完 Go 內存模型,不可能。因此今天這篇文章,把重點劃在給大傢講解 Go 語言的 happens-before 原則這 1 個細節。

內存模型定義是什麼

既然要瞭解 happens-before 原則,我們得先知道 The Go Memory Model(Go 內存模型)定義的是什麼,官方解釋如下:

The Go memory model specifies the conditions under which reads of a variable in one goroutine can be guaranteed to observe values produced by writes to the same variable in a different goroutine.

在 Go 內存模型規定:“在一個 goroutine 中讀取一個變量時,可以保證觀察到不同 goroutine 中對同一變量的寫入所產生的值” 的條件。

這是學習後續知識的一個大前提。

happens-before 是什麼

Happens Before 是一個專業術語,與 Go 語言沒有直接關系,也就是並非是特有的。用大白話來講,其定義是:

在一個多線程程序中,假設存在 A 和 B 兩個操作,如果 A 操作在 B 操作之前發生(A happens-before B),那麼 A 操作對內存的影響將會對執行 B 的線程可見。

A 不一定 happens-before B

從 happens-before 定義來看,我們可以反過來想。那就是:

在同一個(相同)線程中,如果都執行 A 和 B 操作,並且 A 的聲明一定在 B 之前,那麼 A 一定先於(happens-before)B 發生。

以下述 Go 代碼例子:

var A int
var B int
func main() {
 A = B + 1  (1)
 B = 1      (2)
}

該代碼是在同一個 main goroutine,全局變量 A 在變量 B 之前聲明。

在 main 函數中,代碼行 (1),也在代碼行 (2) 之前。因此我們可以得出 (1) 一定會在 (2) 前執行,對嗎?

答案是:錯誤的,因為 A happens-before B 並不意味著 A 操作一定會在 B 操作之前發生。

實際上在編譯器中,上述代碼在匯編的真正執行順序如下:

0x0000 00000 (main.go:7) MOVQ "".B(SB), AX
 0x0007 00007 (main.go:7) INCQ AX
 0x000a 00010 (main.go:7) MOVQ AX, "".A(SB)
 0x0011 00017 (main.go:8) MOVQ $1, "".B(SB)
  • (2):加載 B 到寄存器 AX。
  • (2):進行 B = 1 賦值,在代碼中執行為 INCQ 自增。
  • (1):將寄存器 AX 中值加上 1 後賦值給 A。

通過上述分析,我們可以得知。在代碼行 (1) 在 (2) 之前,但確實 (2) 比 (1) 更早執行。

那麼這是不是意味著違反瞭 happens-before 的設計原則,畢竟這可是同個線程裡的操作,Go 編譯器有 BUG?

其實不然,因為對 A 的賦值實質上對 B 的賦值沒有影響。所以並沒有違反 happens-before 的設計原則。

Go 語言中的 happens-before

在 《The Go Memory Model》 中,給出瞭 Go 語言中 Happens Before 的明確語言定義。

以下術語將會在介紹中用到:

  • 變量 v:一個指代性的變量,用於示例演示。
  • 讀 r:代表讀操作。
  • 寫 w:代表寫操作。

定義

在滿足如下兩點條件下,允許對變量 v 的讀 r 觀察對 v 的寫 w:

  • r 在 w 之前沒有發生。
  • 沒有其他寫到 v 的 w' 發生在 w 之後但在 r 之前。

為瞭保證變量 v 的讀 r 觀察到對 v 的特定寫 w,確保 w 是唯一允許 r 觀察的寫。

因此如果以下兩點都成立,就能保證 r 能觀察到 w :

  • w 發生在 r 之前。
  • 對共享變量 v 的任何其他寫入都發生在 w 之前或 r 之後。

這看起來比較生澀,接下來我們以《The Go Memory Model》 中具體的 channel 例子來進行進一步說明,會更好理解一些。

Go Channel 實例

在 Go 語言中提倡不要通過共享內存來進行通訊;相反,應當通過通訊來共享內存:

Do not communicate by sharing memory; instead, share memory by communicating.

因此在 Go 工程中,Channel 是一個非常常用的語法。在原則上其需要遵守:

  • 一個 channel 上的發送是在該 channel 的相應接收完成之前發生的。
  • channel 的關閉發生在接收之前,因為通道被關閉而返回一個零值。
  • 一個無緩沖 channel 的接收發生在該 channel 的發送完成之前。
  • 一個容量為 C 的 channel 上,第 k 次接收發生在該 channel 的第 k+C 次發送完成之前。

接下來根據這四條原則,我們逐一給出例子,用於學習和理解。

例子 1

Go channel 例子 1,你認為輸出的結果是什麼。如下:

var c = make(chan int, 10)
var a string
func f() {
 a = "炸煎魚"   (1)
 c <- 0        (2)
}
func main() {
 go f()
 <-c           (3)
 print(a)      (4)
}

答案是空字符串嗎?

程序最終結果是正常輸出 “炸煎魚” 的,原因如下:

  • (1) happens-before (2) 。
  • (4) happens-after (3)。

當然,最後 (1) 寫入變量 a 的操作,必然 happens-before 於 (4) print 方法,因此正確的輸出瞭 “炸煎魚”。

能夠滿足 “一個 channel 上的發送是在該 channel 的相應接收完成之前發生的”。

例子 2

主要是確保瞭關閉管道時的行為。隻需要在前面的例子中,替換 c <- 0 成 close(c) 就能夠產生具有相同的行為保證的程序。

能夠滿足 “channel 的關閉發生在接收之前,因為通道被關閉而返回一個零值”。

例子 3

Go channel 例子 3,你認為輸出的結果是什麼。如下:

var c = make(chan int)
var a string
func f() {
 a = "煎魚進腦子瞭"    (1)
 <-c                 (2)
}
func main() {
 go f()
 c <- 0              (3)
 print(a)            (4)
}

答案是空字符串嗎?

程序最終結果是正常輸出 “煎魚進腦子瞭” 的,原因如下:

  • (2) happens-before (3)。
  • (1) happens-before (4)。

能夠滿足 “一個無緩沖 channel 的接收發生在該 channel 的發送完成之前”。

如果我們把無緩沖改為 make(chan int, 1),也就是帶緩沖的 channel,則無法保證正常的輸出 “煎魚進腦子瞭”。

例子 4

Go channel 例子 4,這個程序為工作列表中的每個條目啟動一個 goroutine,但 goroutine 使用 channel 進行協調,以確保每次最多隻有三個工作函數在運行。

代碼如下:

var limit = make(chan int, 3)
func main() {
 for _, w := range work {
  go func(w func()) {
   limit <- 1
   w()
   <-limit
  }(w)
 }
 select{}
}

能夠滿足 “一個容量為 C 的 channel 上,第 k 次接收發生在該 channel 的第 k+C 次發送完成之前”。

總結

在本文中,我們針對 happens-before 原則進行瞭基本的說明。同時結合 Go 語言中實際的 happens-before 和 happens-after 的場景進瞭展示和講解。

實際上,在日常的開發工作中,happens-before 原則基本已經深入到潛意識中,就跟設計模式一樣。會不知覺就應用到,但是若我們希望更進一步的對 Go 語言等內存模型就行研究和理解,就必須對這個基本理念有所認知。

參考

Golang 內存模型詳解(一)

Go內存模型

以上就是Go語言開發必知的一個內存模型細節的詳細內容,更多關於Go語言內存模型細節的資料請關註WalkonNet其它相關文章!

推薦閱讀: