淺析Golang中的內存逃逸

Posted on 2022-10-18 by WalkonNet

什麼是內存逃逸分析

內存逃逸分析是go的編譯器在編譯期間，根據變量的類型和作用域，確定變量是堆上還是棧上

簡單說就是編譯器在編譯期間，對代碼進行分析，確定變量分配內存的位置。如果變量需要分配在堆上，則稱作內存逃逸瞭。

為什麼需要逃逸分析

因為go語言是自動自動內存管理的，也就是有GC的。開發者在寫代碼的時候不需要關心考慮內存釋放的問題，這樣編譯器和go運行時（runtime）就需要準確分配和管理內存，所以編譯器在編譯期間要確定變量是放在堆空間和棧空間。

如果變量放錯瞭位置會怎樣

我們知道，棧空間和生命周期是和函數生命周期相關的，如果一個函數的局部變量離開瞭函數的范圍，比如函數結束時，局部變量就會失效。所以要把這樣的變量放到堆空間上。

既然如此，那把所有在變量都放在堆上不就行瞭，這樣一來，是沒啥問題瞭，但是堆內存的使用成本比占內存要高好多。使用堆內存，要向操作系統申請和歸還，而占內存是程序運行時就確定好瞭，如何使用完全由程序自己確定。在棧上分配和回收內存成本很低，隻需要 2 個 CPU 指令：PUSH 和 POP，push 將數據放到到棧空間完成分配，pop 則是釋放空間。

比如 C++ 經典錯誤，return 一個函數內部變量的指針

#include<iostream>

int* one(){
    int i = 10;
    return &i;
}

int main(){
    std::cout << *one();
}

這段代碼在編譯的時候會如下警告:

one.cpp: 在函數‘int* one()’中:
one.cpp:4:6: 警告：返回瞭局部變量的‘i’的地址 [-Wreturn-local-addr]
int i = 10;
^

雖然程序的運行結果大多數時候都和我們預期的一樣，但是這樣的代碼還是有風險的。

這樣的代碼在go裡就完全沒有問題瞭，因為go的編譯器會根據變量的作用范圍確定變量是放在棧上和堆上。

內存逃逸場景

go的編譯器提供瞭逃逸分析的工具，隻需要在編譯的時候加上 -gcflags=-m 就可以看到逃逸分析的結果瞭

常見的有4種場景下會出現內存逃逸

return 局部變量的指針

package main

func main() {

}

func One() *int {
   i := 10
   return &i
}

執行 go build -gcflags=-m main.go

# command-line-arguments
.\main.go:3:6: can inline main
.\main.go:7:6: can inline One
.\main.go:8:2: moved to heap: i

可以看到變量 i 已經被分配到堆上瞭

interface{} 動態類型

當函數傳遞的變量類型是 interface{} 類型的時候，因為編譯器無法推斷運行時變量的實際類型，所以也會發生逃逸

package main

import "fmt"

func main() {
   i := 10
   fmt.Println(i)
}

執行 go build -gcflags=-m .\main.go

.\main.go:11:13: inlining call to fmt.Println
.\main.go:11:13: i escapes to heap
.\main.go:11:13: []interface {} literal does not escape
<autogenerated>:1: .this does not escape
<autogenerated>:1: .this does not escape

可看到，i 也被分配到棧上瞭

棧空間不足

因為棧的空間是有限的，所以在分配大塊內存時，會考慮棧空間內否存下，如果棧空間存不下，會分配到堆上。

package main

func main() {
   Make10()
   Make100()
   Make10000()
   MakeN(5)
}

func Make10() {
   arr10 := make([]int, 10)
   _ = arr10
}

func Make100() {
   arr100 := make([]int, 100)
   _ = arr100
}

func Make10000() {
   arr10000 := make([]int, 10000)
   _ = arr10000
}

func MakeN(n int) {
   arrN := make([]int, n)
   _ = arrN
}

執行 go build -gcflags=-m main.go

# command-line-arguments
.\main.go:10:6: can inline Make10
.\main.go:15:6: can inline Make100
.\main.go:20:6: can inline Make10000
.\main.go:25:6: can inline MakeN
.\main.go:3:6: can inline main
.\main.go:4:8: inlining call to Make10
.\main.go:5:9: inlining call to Make100
.\main.go:6:11: inlining call to Make10000
.\main.go:7:7: inlining call to MakeN
.\main.go:4:8: make([]int, 10) does not escape
.\main.go:5:9: make([]int, 100) does not escape
.\main.go:6:11: make([]int, 10000) escapes to heap
.\main.go:7:7: make([]int, n) escapes to heap
.\main.go:11:15: make([]int, 10) does not escape
.\main.go:16:16: make([]int, 100) does not escape
.\main.go:21:18: make([]int, 10000) escapes to heap
.\main.go:26:14: make([]int, n) escapes to heap

可以看到當需要分配長度為10，100的int類型的slice時，不需要逃逸到堆上，在棧上就可以，如果slice長度達到1000時，就需要分配到堆上瞭。

還有一種情況，當在編譯期間長度不確定時，也需要分配到堆上。

閉包

package main

func main() {
   One()
}

func One() func() {
   n := 10
   return func() {
      n++
   }
}

在函數One中return瞭一個匿名函數，形成瞭一個閉包，看一下逃逸分析

# command-line-arguments
.\main.go:3:6: can inline main
.\main.go:9:9: can inline One.func1
.\main.go:8:2: moved to heap: n
.\main.go:9:9: func literal escapes to heap

可以看到變量 n 也分配到堆上瞭

還有一種情況，new 出來的變量不一定分配到堆上

package main

func main() {
   i := new(int)
   _ = i
}

像java C++等語言，new 出來的變量正常都會分配到堆上，但是在go裡，new出來的變量不一定分配到堆上，至於分配到哪裡，還是看編譯器的逃逸分析來確定

編譯一下看看 go build -gcflags=-m main.go

# command-line-arguments
.\main.go:3:6: can inline main
.\main.go:4:10: new(int) does not escape

可以看到 new出來的變量，並沒有逃逸，還是在棧上。

常見的內存逃逸場景差不多就是這些瞭，再說一下內存逃逸帶來的影響吧

性能

那肯定就是性能問題瞭，因為操作棧空間比堆空間要快多瞭，而且使用堆空間還會有GC問題，頻繁的創建和釋放堆空間，會增加GC的壓力

一個簡單的例子測試一下，一般來說，函數返回結構體的指針比直接返回結構體性能要好

package main

import "testing"

type MyStruct struct {
   A int
}

func BenchmarkOne(b *testing.B) {
   for i := 0; i < b.N; i++ {
      One()
   }
}

//go:noinline
func One() MyStruct {
   return MyStruct{
      A: 10,
   }
}

func BenchmarkTwo(b *testing.B) {
   for i := 0; i < b.N; i++ {
      Two()
   }
}

//go:noinline
func Two() *MyStruct {
   return &MyStruct{
      A: 10,
   }
}

註意被調用的函數一定要加上 //go:noinline 來禁止編譯器內聯優化

然後執行

go test -bench . -benchmem

goos: windows
goarch: amd64
pkg: escape
BenchmarkOne-6          951519297                1.26 ns/op            0 B/op          0 allocs/op
BenchmarkTwo-6          74933496                15.4 ns/op             8 B/op          1 allocs/op
PASS
ok      escape  2.698s

可以明顯看到函數 One返回結構體比函數Two 返回結構體指針的性能更好，而且還不會有內存分配，不會增加GC壓力

拋開結構體的大小談性能都是耍流氓，如果結構體比較復雜瞭還是指針性能更高，還有一些場景必須使用指針，所以實際工作中還是要分場景合理使用

最後

常見的go 逃逸分析差不多就是這些瞭，雖然go會自動管理內存，減小瞭寫代碼的負擔，但是想要寫出高效可靠的代碼還是有一些細節有註意的。

以上就是淺析Golang中的內存逃逸的詳細內容，更多關於Golang內存逃逸的資料請關註WalkonNet其它相關文章！

淺析Golang中的內存逃逸

目錄

什麼是內存逃逸分析

為什麼需要逃逸分析

如果變量放錯瞭位置會怎樣

內存逃逸場景

return 局部變量的指針

interface{} 動態類型

棧空間不足

閉包

性能

最後

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

什麼是內存逃逸分析

為什麼需要逃逸分析

如果變量放錯瞭位置會怎樣

內存逃逸場景

return 局部變量的指針

interface{} 動態類型

棧空間不足

閉包

性能

最後

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆