Linux內存管理和尋址詳細介紹

1.概念

內存管理模式

段式:內存分為瞭多段,每段都是連續的內存,不同的段對應不用的用途。每個段的大小都不是統一的,會導致內存碎片和內存交換效率低的問題。

頁式:內存劃分為多個內存頁進行管理,如在 Linux 系統中,每一頁的大小為 4KB。由於分瞭頁後,就不會產生細小的內存碎片。但是仍然也存在內存碎片問題。

段頁式:段式和頁式結合。

地址類型劃分

邏輯地址:程序所使用的地址,通常是沒被段式內存管理映射的地址,稱為邏輯地址

線性地址:通過段式內存管理映射的地址,稱為線性地址,也叫虛擬地址

虛擬地址:通過段式內存管理映射的地址,稱為線性地址,也叫虛擬地址

物理地址:物理內存地址

說明:

Inetel處理器中,邏輯地址是「段式內存管理」轉換前的地址,線性地址則是「頁式內存管理」轉換前的地址。

段式內存管理映射而成的地址不再是“物理地址”瞭,Intel 就稱之為“線性地址”(也稱虛擬地址)。於是,段式內存管理先將邏輯地址映射成線性地址,然後再由頁式內存管理將線性地址映射成物理地址。

linux內存主要是頁式內存管理,同時也有涉及段式機制。當前Linux內核所采取的辦法是使段式映射的過程實際上不起什麼作用。

Intel最早處理器80286是純段式管理,80386段式和頁式均存在。

2.頁式管理

x86架構32位cpu

​ 二級頁表選址方式,一個內存頁4KB大小,一級頁目錄表1024項,二級頁表1024項,一個頁表項4字節。一級頁目錄表項全部分配,二級頁表在需要的時候創建。(局部性原理)。

虛擬地址32位

10+10+12,分別索引1級頁表號,2級頁表項,記錄物理基地址的偏移地址。使用PAE機制之後32bit系統支持最大的內存是64GB(地址是32+4=36位)。

線性地址尋址物理地址步驟

先根據10位尋址1級頁表號,1級頁表號中記錄瞭2級頁表的地址

找到2級頁表地址後,接著根據虛擬地址的另10位尋找2級頁表中表項的位置

找到2級頁表的表項之後,表項中記錄瞭該虛擬地址映射物理地址的起始地址,表項的大小是4字節32bit

根據找到的物理地址的起始地址結合虛擬地址的後12位作為偏移計算出最終的物理地址

x86架構 64位cpu

存在更多級頁表

全局頁目錄項 PGD(Page Global Directory上層頁目錄項 PUD(Page Upper Directory)中間頁目錄項 PMD(Page Middle Directory)頁表項 PTE(Page Table Entry)

線性地址尋址物理地址步驟

線性地址為48bit,最大物理地址為52bit,實際物理內存地址總線寬度是40bit,也就是支持1TB物理內存x86_64有四級頁表,原理同x86系統,也是一層層的尋址CR3寄存器保存最高層一級表的起始物理地址,因此尋址首先就是要獲取到CR3寄存器中的值每個PTE表項的大小是8個字節也就是64bit

TLB

在 CPU 芯片中,加入瞭一個專門存放程序最常訪問的頁表項的 Cache,這個 Cache 就是 TL(Translation Lookaside Buffer) 。通常稱為頁表緩存、轉址旁路緩存、快表等。那麼在CPU的內存管理單元MMU尋址時,會先查 TLB,如果沒找到,才會繼續查常規的頁表。

專有名詞

PDT:頁目錄表,多級頁表一級頁表,32bit系統有1024個頁目錄
PTT:頁表項表,多級頁表二級頁表,32bit系統有每個頁目錄下有1024個頁表項,每個表項4個字節
PDE:頁表的基址,是PDT中一項
PTE:是頁的基址,是PTT中一項
GDT:全局描述符表,邏輯地址轉為線性地址用到
LDT:局部描述符表,邏輯地址轉為線性地址用到

3.地址劃分

32系統
內核1G: 0xC0 00 00 01 – 0xFF FF FF FF
用戶3G: 0x00 00 00 00 – 0xC0 00 00 00
0xC0 00 00 00 == 3G

64位系統:
內核128T: 0xFF FF 80 00 00 00 00 00 – 0xFF FF FF FF FF FF FF FF (高位)
0xFF FF 7F FF FF FF FF FF – 0xFF FF FF FF FF FF FF FF(自己計算)

用戶128T: 0x00 00 00 00 00 00 00 00 – 0x00 00 7F FF FF FF FF FF (低位)
0x00 00 80 00 00 00 00 00 – 0x00 00 80 00 00 00 00 00 (自己計算)

​ 0x00 00 7F FF FF FF FF FF == 127T
​ 疑問:64位系統128T是分界線是127T?

訪問權限

進程在用戶態時,隻能訪問用戶空間內存
隻有進入內核態後,才可以訪問內核空間的內存

PAE機制

​ CPU位寬指的是一個時鐘周期內CPU能處理的二進制位數,普通場景中32位系統CPU的地址總線可以是32位,但是引入瞭PAE機制之後,16位CPU的地址總線位寬可以是20位(物理內存1M),32位CPU的地址總線可以是36位(物理內存64GB),64位CPU的地址總線位寬可以是40位(物理內存1TB)。因此我們不能簡單的說32位系統隻支持最大4GB的內存條。

4. 調試

程序寄存器

cs:是代碼段寄存器
ds:是數據段寄存器
ss:是堆棧段寄存器
es:是擴展段寄存器
fs:是標志段寄存器 32位之後才有
gs:是全局段寄存器 32位之後才有

示例一個內核宕機的日志:

RIP: 0010:[] [] xxxxxxxxxx+0x69/0x70
RSP: 0018:ffff886241737d98 EFLAGS: 00010246
RAX: ffff880034814d40 RBX: ffff881fc6248740 RCX: 0000000000000200
RDX: 0000000000000000 RSI: 0000000000000286 RDI: ffff881fc6381858
RBP: ffff886241737d98 R08: ffff886241734000 R09: 0000000000000000
R10: ffff880034814d40 R11: 0000000000000200 R12: ffff881fc62487a0
R13: 0000000000000000 R14: 00007fff86cb6260 R15: ffff881fc6381858
FS: 00007f78b59b8720(0000) GS:ffff885ffe3c0000(0000) knlGS:0000000000000000
CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
CR2: 00007f690a057180 CR3: 0000006208985000 CR4: 00000000003627e0
DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
DR3: 0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400

查看程序寄存器

使用GDB隨意調試一個linux 32位上的ELF32的可執行文件,使用info r命令查看一下寄存器情況:

段寄存器有0x23和0x2b兩種情況:

十六進制:0023
二進制:0000000000100 0 11 – 段序號:4 – 表類型:GDT – 特權級:Ring3
十六進制:002B
二進制:0000000000101 0 11 – 段序號:5 – 表類型:GDT – 特權級:Ring3

段序號:從第四位開始 表類型:第三位 特權級:第1、2位

Linux下沒有找到可以直接用什麼命令或者工具查看GDT的方式,於是去源代碼中尋找答案:

看到瞭嗎,這兩項所描述的段和Windows一樣,基地址為0,大小為4GB。

Windows和Linux都選擇瞭通過這種方式架空瞭CPU的分段內存管理機制。

但需要說明一下的時,雖然兩個操作系統都是這種情況,但並不意味著段機制徹底沒用到,CPU的任務管理TSS還是需要用到,這一點大傢知道就行瞭,在linux64位系統下分段機制不被待見,但是操作系統仍然會保持先分段再分頁的尋址方式。

結語

到此這篇關於Linux內存管理和尋址詳細介紹的文章就介紹到這瞭,更多相關Linux內存管理和尋址內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: