淺析Golang中的內存逃逸
什麼是內存逃逸分析
內存逃逸分析是go的編譯器在編譯期間,根據變量的類型和作用域,確定變量是堆上還是棧上
簡單說就是編譯器在編譯期間,對代碼進行分析,確定變量分配內存的位置。如果變量需要分配在堆上,則稱作內存逃逸瞭。
為什麼需要逃逸分析
因為go語言是自動自動內存管理的,也就是有GC的。開發者在寫代碼的時候不需要關心考慮內存釋放的問題,這樣編譯器和go運行時(runtime)就需要準確分配和管理內存,所以編譯器在編譯期間要確定變量是放在堆空間和棧空間。
如果變量放錯瞭位置會怎樣
我們知道,棧空間和生命周期是和函數生命周期相關的,如果一個函數的局部變量離開瞭函數的范圍,比如函數結束時,局部變量就會失效。所以要把這樣的變量放到堆空間上。
既然如此,那把所有在變量都放在堆上不就行瞭,這樣一來,是沒啥問題瞭,但是堆內存的使用成本比占內存要高好多。使用堆內存,要向操作系統申請和歸還,而占內存是程序運行時就確定好瞭,如何使用完全由程序自己確定。在棧上分配和回收內存成本很低,隻需要 2 個 CPU 指令:PUSH 和 POP,push 將數據放到到棧空間完成分配,pop 則是釋放空間。
比如 C++ 經典錯誤,return 一個 函數內部變量的指針
#include<iostream> int* one(){ int i = 10; return &i; } int main(){ std::cout << *one(); }
這段代碼在編譯的時候會如下警告:
one.cpp: 在函數‘int* one()’中:
one.cpp:4:6: 警告:返回瞭局部變量的‘i’的地址 [-Wreturn-local-addr]
int i = 10;
^
雖然程序的運行結果大多數時候都和我們預期的一樣,但是這樣的代碼還是有風險的。
這樣的代碼在go裡就完全沒有問題瞭,因為go的編譯器會根據變量的作用范圍確定變量是放在棧上和堆上。
內存逃逸場景
go的編譯器提供瞭逃逸分析的工具,隻需要在編譯的時候加上 -gcflags=-m
就可以看到逃逸分析的結果瞭
常見的有4種場景下會出現內存逃逸
return 局部變量的指針
package main func main() { } func One() *int { i := 10 return &i }
執行 go build -gcflags=-m main.go
# command-line-arguments .\main.go:3:6: can inline main .\main.go:7:6: can inline One .\main.go:8:2: moved to heap: i
可以看到變量 i
已經被分配到堆上瞭
interface{} 動態類型
當函數傳遞的變量類型是 interface{}
類型的時候,因為編譯器無法推斷運行時變量的實際類型,所以也會發生逃逸
package main import "fmt" func main() { i := 10 fmt.Println(i) }
執行 go build -gcflags=-m .\main.go
.\main.go:11:13: inlining call to fmt.Println .\main.go:11:13: i escapes to heap .\main.go:11:13: []interface {} literal does not escape <autogenerated>:1: .this does not escape <autogenerated>:1: .this does not escape
可看到,i
也被分配到棧上瞭
棧空間不足
因為棧的空間是有限的,所以在分配大塊內存時,會考慮棧空間內否存下,如果棧空間存不下,會分配到堆上。
package main func main() { Make10() Make100() Make10000() MakeN(5) } func Make10() { arr10 := make([]int, 10) _ = arr10 } func Make100() { arr100 := make([]int, 100) _ = arr100 } func Make10000() { arr10000 := make([]int, 10000) _ = arr10000 } func MakeN(n int) { arrN := make([]int, n) _ = arrN }
執行 go build -gcflags=-m main.go
# command-line-arguments .\main.go:10:6: can inline Make10 .\main.go:15:6: can inline Make100 .\main.go:20:6: can inline Make10000 .\main.go:25:6: can inline MakeN .\main.go:3:6: can inline main .\main.go:4:8: inlining call to Make10 .\main.go:5:9: inlining call to Make100 .\main.go:6:11: inlining call to Make10000 .\main.go:7:7: inlining call to MakeN .\main.go:4:8: make([]int, 10) does not escape .\main.go:5:9: make([]int, 100) does not escape .\main.go:6:11: make([]int, 10000) escapes to heap .\main.go:7:7: make([]int, n) escapes to heap .\main.go:11:15: make([]int, 10) does not escape .\main.go:16:16: make([]int, 100) does not escape .\main.go:21:18: make([]int, 10000) escapes to heap .\main.go:26:14: make([]int, n) escapes to heap
可以看到當需要分配長度為10,100的int類型的slice時,不需要逃逸到堆上,在棧上就可以,如果slice長度達到1000時,就需要分配到堆上瞭。
還有一種情況,當在編譯期間長度不確定時,也需要分配到堆上。
閉包
package main func main() { One() } func One() func() { n := 10 return func() { n++ } }
在函數One
中return瞭一個匿名函數,形成瞭一個閉包,看一下逃逸分析
# command-line-arguments .\main.go:3:6: can inline main .\main.go:9:9: can inline One.func1 .\main.go:8:2: moved to heap: n .\main.go:9:9: func literal escapes to heap
可以看到 變量 n
也分配到堆上瞭
還有一種情況,new
出來的變量不一定分配到堆上
package main func main() { i := new(int) _ = i }
像java C++等語言,new 出來的變量正常都會分配到堆上,但是在go裡,new出來的變量不一定分配到堆上,至於分配到哪裡,還是看編譯器的逃逸分析來確定
編譯一下看看 go build -gcflags=-m main.go
# command-line-arguments .\main.go:3:6: can inline main .\main.go:4:10: new(int) does not escape
可以看到 new出來的變量,並沒有逃逸,還是在棧上。
常見的內存逃逸場景差不多就是這些瞭,再說一下內存逃逸帶來的影響吧
性能
那肯定就是性能問題瞭,因為操作棧空間比堆空間要快多瞭,而且使用堆空間還會有GC問題,頻繁的創建和釋放堆空間,會增加GC的壓力
一個簡單的例子測試一下,一般來說,函數返回結構體的指針比直接返回結構體性能要好
package main import "testing" type MyStruct struct { A int } func BenchmarkOne(b *testing.B) { for i := 0; i < b.N; i++ { One() } } //go:noinline func One() MyStruct { return MyStruct{ A: 10, } } func BenchmarkTwo(b *testing.B) { for i := 0; i < b.N; i++ { Two() } } //go:noinline func Two() *MyStruct { return &MyStruct{ A: 10, } }
註意 被調用的函數一定要加上 //go:noinline
來禁止編譯器內聯優化
然後執行
go test -bench . -benchmem
goos: windows goarch: amd64 pkg: escape BenchmarkOne-6 951519297 1.26 ns/op 0 B/op 0 allocs/op BenchmarkTwo-6 74933496 15.4 ns/op 8 B/op 1 allocs/op PASS ok escape 2.698s
可以明顯看到 函數 One
返回結構體 比 函數Two
返回 結構體指針 的性能更好,而且還不會有內存分配,不會增加GC壓力
拋開結構體的大小談性能都是耍流氓,如果結構體比較復雜瞭還是指針性能更高,還有一些場景必須使用指針,所以實際工作中還是要分場景合理使用
最後
常見的go 逃逸分析差不多就是這些瞭,雖然go會自動管理內存,減小瞭寫代碼的負擔,但是想要寫出高效可靠的代碼還是有一些細節有註意的。
以上就是淺析Golang中的內存逃逸的詳細內容,更多關於Golang內存逃逸的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Go編譯原理之函數內聯
- Go語言基礎單元測試與性能測試示例詳解
- golang 刪除切片的某個元素及剔除切片內的零值方式
- Go 修改map slice array元素值操作
- Golang: 內建容器的用法