淺析Golang中的內存逃逸

什麼是內存逃逸分析

內存逃逸分析是go的編譯器在編譯期間,根據變量的類型和作用域,確定變量是堆上還是棧上

簡單說就是編譯器在編譯期間,對代碼進行分析,確定變量分配內存的位置。如果變量需要分配在堆上,則稱作內存逃逸瞭。

為什麼需要逃逸分析

因為go語言是自動自動內存管理的,也就是有GC的。開發者在寫代碼的時候不需要關心考慮內存釋放的問題,這樣編譯器和go運行時(runtime)就需要準確分配和管理內存,所以編譯器在編譯期間要確定變量是放在堆空間和棧空間。

如果變量放錯瞭位置會怎樣

我們知道,棧空間和生命周期是和函數生命周期相關的,如果一個函數的局部變量離開瞭函數的范圍,比如函數結束時,局部變量就會失效。所以要把這樣的變量放到堆空間上。

既然如此,那把所有在變量都放在堆上不就行瞭,這樣一來,是沒啥問題瞭,但是堆內存的使用成本比占內存要高好多。使用堆內存,要向操作系統申請和歸還,而占內存是程序運行時就確定好瞭,如何使用完全由程序自己確定。在棧上分配和回收內存成本很低,隻需要 2 個 CPU 指令:PUSHPOP,push 將數據放到到棧空間完成分配,pop 則是釋放空間。

比如 C++ 經典錯誤,return 一個 函數內部變量的指針

#include<iostream>

int* one(){
    int i = 10;
    return &i;
}

int main(){
    std::cout << *one();
}

這段代碼在編譯的時候會如下警告:

one.cpp: 在函數‘int* one()’中:
one.cpp:4:6: 警告:返回瞭局部變量的‘i’的地址 [-Wreturn-local-addr]
  int i = 10;
      ^

雖然程序的運行結果大多數時候都和我們預期的一樣,但是這樣的代碼還是有風險的。

這樣的代碼在go裡就完全沒有問題瞭,因為go的編譯器會根據變量的作用范圍確定變量是放在棧上和堆上。

內存逃逸場景

go的編譯器提供瞭逃逸分析的工具,隻需要在編譯的時候加上 -gcflags=-m 就可以看到逃逸分析的結果瞭

常見的有4種場景下會出現內存逃逸

return 局部變量的指針

package main

func main() {

}

func One() *int {
   i := 10
   return &i
}

執行 go build -gcflags=-m main.go

# command-line-arguments
.\main.go:3:6: can inline main
.\main.go:7:6: can inline One
.\main.go:8:2: moved to heap: i

可以看到變量 i 已經被分配到堆上瞭

interface{} 動態類型

當函數傳遞的變量類型是 interface{} 類型的時候,因為編譯器無法推斷運行時變量的實際類型,所以也會發生逃逸

package main

import "fmt"

func main() {
   i := 10
   fmt.Println(i)
}

執行 go build -gcflags=-m .\main.go

.\main.go:11:13: inlining call to fmt.Println
.\main.go:11:13: i escapes to heap
.\main.go:11:13: []interface {} literal does not escape
<autogenerated>:1: .this does not escape
<autogenerated>:1: .this does not escape

可看到,i 也被分配到棧上瞭

棧空間不足

因為棧的空間是有限的,所以在分配大塊內存時,會考慮棧空間內否存下,如果棧空間存不下,會分配到堆上。

package main

func main() {
   Make10()
   Make100()
   Make10000()
   MakeN(5)
}

func Make10() {
   arr10 := make([]int, 10)
   _ = arr10
}

func Make100() {
   arr100 := make([]int, 100)
   _ = arr100
}

func Make10000() {
   arr10000 := make([]int, 10000)
   _ = arr10000
}

func MakeN(n int) {
   arrN := make([]int, n)
   _ = arrN
}

執行 go build -gcflags=-m main.go

# command-line-arguments
.\main.go:10:6: can inline Make10
.\main.go:15:6: can inline Make100
.\main.go:20:6: can inline Make10000
.\main.go:25:6: can inline MakeN
.\main.go:3:6: can inline main
.\main.go:4:8: inlining call to Make10
.\main.go:5:9: inlining call to Make100
.\main.go:6:11: inlining call to Make10000
.\main.go:7:7: inlining call to MakeN
.\main.go:4:8: make([]int, 10) does not escape
.\main.go:5:9: make([]int, 100) does not escape
.\main.go:6:11: make([]int, 10000) escapes to heap
.\main.go:7:7: make([]int, n) escapes to heap
.\main.go:11:15: make([]int, 10) does not escape
.\main.go:16:16: make([]int, 100) does not escape
.\main.go:21:18: make([]int, 10000) escapes to heap
.\main.go:26:14: make([]int, n) escapes to heap

可以看到當需要分配長度為10,100的int類型的slice時,不需要逃逸到堆上,在棧上就可以,如果slice長度達到1000時,就需要分配到堆上瞭。

還有一種情況,當在編譯期間長度不確定時,也需要分配到堆上。

閉包

package main

func main() {
   One()
}

func One() func() {
   n := 10
   return func() {
      n++
   }
}

在函數One中return瞭一個匿名函數,形成瞭一個閉包,看一下逃逸分析

# command-line-arguments
.\main.go:3:6: can inline main
.\main.go:9:9: can inline One.func1
.\main.go:8:2: moved to heap: n
.\main.go:9:9: func literal escapes to heap

可以看到 變量 n 也分配到堆上瞭

還有一種情況,new 出來的變量不一定分配到堆上

package main

func main() {
   i := new(int)
   _ = i
}

像java C++等語言,new 出來的變量正常都會分配到堆上,但是在go裡,new出來的變量不一定分配到堆上,至於分配到哪裡,還是看編譯器的逃逸分析來確定

編譯一下看看 go build -gcflags=-m main.go

# command-line-arguments
.\main.go:3:6: can inline main
.\main.go:4:10: new(int) does not escape

可以看到 new出來的變量,並沒有逃逸,還是在棧上。

常見的內存逃逸場景差不多就是這些瞭,再說一下內存逃逸帶來的影響吧

性能

那肯定就是性能問題瞭,因為操作棧空間比堆空間要快多瞭,而且使用堆空間還會有GC問題,頻繁的創建和釋放堆空間,會增加GC的壓力

一個簡單的例子測試一下,一般來說,函數返回結構體的指針比直接返回結構體性能要好

package main

import "testing"

type MyStruct struct {
   A int
}

func BenchmarkOne(b *testing.B) {
   for i := 0; i < b.N; i++ {
      One()
   }
}

//go:noinline
func One() MyStruct {
   return MyStruct{
      A: 10,
   }
}

func BenchmarkTwo(b *testing.B) {
   for i := 0; i < b.N; i++ {
      Two()
   }
}

//go:noinline
func Two() *MyStruct {
   return &MyStruct{
      A: 10,
   }
}

註意 被調用的函數一定要加上 //go:noinline 來禁止編譯器內聯優化

然後執行

go test -bench . -benchmem

goos: windows
goarch: amd64
pkg: escape
BenchmarkOne-6          951519297                1.26 ns/op            0 B/op          0 allocs/op
BenchmarkTwo-6          74933496                15.4 ns/op             8 B/op          1 allocs/op
PASS
ok      escape  2.698s

可以明顯看到 函數 One返回結構體 比 函數Two 返回 結構體指針 的性能更好,而且還不會有內存分配,不會增加GC壓力

拋開結構體的大小談性能都是耍流氓,如果結構體比較復雜瞭還是指針性能更高,還有一些場景必須使用指針,所以實際工作中還是要分場景合理使用

最後

常見的go 逃逸分析差不多就是這些瞭,雖然go會自動管理內存,減小瞭寫代碼的負擔,但是想要寫出高效可靠的代碼還是有一些細節有註意的。

以上就是淺析Golang中的內存逃逸的詳細內容,更多關於Golang內存逃逸的資料請關註WalkonNet其它相關文章!

推薦閱讀: