GoLang函數棧的使用詳細講解
函數棧幀
我們的代碼會被編譯成機器指令並寫入到可執行文件,當程序執行時,可執行文件被加載到內存,這些機器指令會被存儲到虛擬地址空間中的代碼段,在代碼段內部,指令是低地址向高地址堆積的。堆區存儲的是需要程序員手動alloc並free的空間,需要自己來控制。
虛擬內存空間是對存儲器的一層抽象,是為瞭更好的來管理存儲器,虛擬內存和存儲器之間存在映射關系。
如果在一個函數中調用瞭另外一個函數,編譯器就會對應生成一條call指令,當call指令被執行時,就會跳轉到被調用函數入口處開始執行,而每個函數的最後都有一條ret指令,負責在函數結束後跳回到調用處繼續執行。
call 指令做瞭兩件事,將下一條指令的地址入棧,這就是IP寄存器中存儲的值,第二,跳轉到被調用函數入口處執行。
函數執行時需要有足夠的內存空間用來存儲參數,局部變量,返回值,這塊空間對應的就是棧,棧區是從高地址向低地址生長的,且先進後出。分配給函數的棧空間被稱為函數棧幀。
C語言中,每個棧幀對應著一個未運行完的函數。棧幀中保存瞭該函數的返回地址和局部變量。
寄存器
ESP寄存器:ESP即 Extended stack pointer 的縮寫,直譯過來就是擴展的棧指針寄存器。SP是16位的,ESP是32位的,RSP是64位的,存放的都是棧頂地址。
EBP寄存器:EBP即 Extended base pointer 的縮寫,直譯過來就是擴展的基址指針寄存器。該指針總是指向當前棧幀的底部。
IP寄存器:指令指針,它指向代碼段中的地址,是一個16位專用寄存器,它指向當前需要取出的指令字節,也就是下一個將要執行的指令在代碼段中的地址。
eax:累加(Accumulator)寄存器,常用於函數返回值
ebx:基址(Base)寄存器,以它為基址訪問內存
ecx:計數器(Counter)寄存器,常用作字符串和循環操作中的計數器
edx:數據(Data)寄存器,常用於乘除法和I/O指針
esi:源地址寄存器
edi:目的地址寄存器
esp:堆棧指針
ebp:棧指針寄存器
當然,以上功能並未限制寄存器的使用,特殊情況為瞭效率也可作其他用途。
這八個寄存器低16位分別有一個引用別名 ax, bx, cx, dx, bp, si, di, sp,
其中 ax, bx, cx, dx, 的高8位又引用至 ah, bh, ch, dh,低八位引用至 al, bl, cl, dl
在 64-bit 模式下,有16個通用寄存器,但是這16個寄存器是兼容32位模式的,
32位方式下寄存器名分別為 eax, ebx, ecx, edx, edi, esi, ebp, esp, r8d – r15d.
在64位模式下,他們被擴展為 rax, rbx, rcx, rdx, rdi, rsi, rbp, rsp, r8 – r15.
其中 r8 – r15 這八個寄存器是64-bit模式下新加入的寄存器。
我們看到CPU在執行代碼段中的指令,而這當中又伴隨著內存的分配,於是在函數棧幀上就會有相應的變化。
int add(int a, int b) { int c = 4; c = a + b; return c; } int main() { int a = 1; int b = 2; int sum = 3; sum = add(a, b); return 0; }
生成的匯編代碼的方式
1、使用 gcc + objdump
gcc -save-temps -fverbose-asm -g -o b testasm.c
objdump -S –disassemble b > b.objdump
2、使用第三方網站來生成,進入 https://godbolt.org/,選擇語言為C
,編譯器為x86-64 gcc 12.2
,粘貼進你的代碼,就能看到匯編代碼,如下
add:
push rbp
mov rbp, rsp
mov DWORD PTR [rbp-20], edi
mov DWORD PTR [rbp-24], esi
mov DWORD PTR [rbp-4], 4
mov edx, DWORD PTR [rbp-20]
mov eax, DWORD PTR [rbp-24]
add eax, edx
mov DWORD PTR [rbp-4], eax
mov eax, DWORD PTR [rbp-4]
pop rbp
ret
main:
push rbp
mov rbp, rsp
sub rsp, 16
mov DWORD PTR [rbp-4], 1
mov DWORD PTR [rbp-8], 2
mov DWORD PTR [rbp-12], 3
mov edx, DWORD PTR [rbp-8]
mov eax, DWORD PTR [rbp-4]
mov esi, edx
mov edi, eax
call add
mov DWORD PTR [rbp-12], eax
mov eax, 0
leave
ret
從main開始解讀
// 此時rbp存儲的還是上一層函數(調用者)的棧基地址,將rbp的值入棧保存起來,因為main函數也是被其他函 // 數調用的,運行完main之後還得回到那個函數體中去。這裡的地址指的是指令的地址,是代碼段中的位置。 // push指令會使rsp下移。 push rbp // 此時rbp存儲的還是上一個函數的基地址,而rsp則已經遊走到瞭main函數這裡,mov指令將rsp中存儲的地址傳遞 // 給rbp,也就意味著執行完之後rbp和rsp都處於main函數的開始位置,稱為初始化操作。 mov rbp, rsp // rsp下移16,就是分配棧空間 sub rsp, 16
// DWORD 為雙字,即四個字節,PTR為指針的意思,此句意為在rbp向下偏移4個字節的這段棧內存中存儲0 // a mov DWORD PTR [rbp-4], 1 // b mov DWORD PTR [rbp-8], 2 // sum mov DWORD PTR [rbp-12], 3 // 將參數從右到左,依次存起來,此處存到瞭 edx和eax,並拷貝瞭一份到esi和edi。 mov edx, DWORD PTR [rbp-8]` mov eax, DWORD PTR [rbp-4]` mov esi, edx` mov edi, eax`
// 執行call指令
// 註意,call會使CPU跳入到add的棧幀中去,那麼執行完之後,我們需要跳回到被調用處繼續向下執行,由
// 最前面的push指令我們已經把調用者的棧基存瞭下來,可是我們還要精確到具體是回到哪個指令,這就是call
// 指令的額外工作,它會先將IP入棧(push ip),因為IP中存的就是下一條指令(mov DWORD PTR [rbp-12], eax)
// 的地址,然後再去跳轉(jmp),將add函數的第一條指令寫入IP,此後就進入add函數棧幀。
call add
// cpu執行完運算後會將結果存儲在寄存器中,至於它會把結果存儲在那個寄存器,這個由編譯器編譯出的指令 // 決定的,由add函數的指令來看,它選擇瞭eax // rbp-12 為sum的位置,這條指令將eax寄存器的值賦值給sum mov DWORD PTR [rbp-12], eax // 將eax置0,也就是main的返回值 mov eax, 0 // 意為 mov rsp, rbp 和 pop rbp 的組合 // 此時rbp為main函數的棧基,rsp為main函數的末尾瞭,將rbp賦值給rsp,於是它們都指向main函數的棧基,上 // 面解釋過,rbp寄存器存儲的地址指向的棧上的空間存儲的還是一個地址,此地址指向調用者的棧基, // pop rbp 將棧頂rsp的數據送入rbp,就意味著之後就回到瞭調用者的棧幀瞭,同時pop會伴隨著rsp的上移, // 於是rsp來到瞭EIP的位置。 leave // 相當於 pop ip // 此函數執行完需要跳回到調用者並繼續執行下一條指令,由於call的時候已經將下一條指令的地址入棧瞭,所以 // 此處值需要將其彈出即可。 ret
到此這篇關於GoLang函數棧的使用詳細講解的文章就介紹到這瞭,更多相關Go函數棧內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!