Linux內存管理和尋址詳細介紹
1.概念
內存管理模式
段式:內存分為瞭多段,每段都是連續的內存,不同的段對應不用的用途。每個段的大小都不是統一的,會導致內存碎片和內存交換效率低的問題。
頁式:內存劃分為多個內存頁進行管理,如在 Linux 系統中,每一頁的大小為 4KB
。由於分瞭頁後,就不會產生細小的內存碎片。但是仍然也存在內存碎片問題。
段頁式:段式和頁式結合。
地址類型劃分
邏輯地址:程序所使用的地址,通常是沒被段式內存管理映射的地址,稱為邏輯地址
線性地址:通過段式內存管理映射的地址,稱為線性地址,也叫虛擬地址
虛擬地址:通過段式內存管理映射的地址,稱為線性地址,也叫虛擬地址
物理地址:物理內存地址
說明:
Inetel處理器中,邏輯地址是「段式內存管理」轉換前的地址,線性地址則是「頁式內存管理」轉換前的地址。
段式內存管理映射而成的地址不再是“物理地址”瞭,Intel 就稱之為“線性地址”(也稱虛擬地址)。於是,段式內存管理先將邏輯地址映射成線性地址,然後再由頁式內存管理將線性地址映射成物理地址。
linux內存主要是頁式內存管理,同時也有涉及段式機制。當前Linux內核所采取的辦法是使段式映射的過程實際上不起什麼作用。
Intel最早處理器80286是純段式管理,80386段式和頁式均存在。
2.頁式管理
x86架構32位cpu
二級頁表選址方式,一個內存頁4KB大小,一級頁目錄表1024項,二級頁表1024項,一個頁表項4字節。一級頁目錄表項全部分配,二級頁表在需要的時候創建。(局部性原理)。
虛擬地址32位
10+10+12,分別索引1級頁表號,2級頁表項,記錄物理基地址的偏移地址。使用PAE機制之後32bit系統支持最大的內存是64GB(地址是32+4=36位)。
線性地址尋址物理地址步驟
先根據10位尋址1級頁表號,1級頁表號中記錄瞭2級頁表的地址
找到2級頁表地址後,接著根據虛擬地址的另10位尋找2級頁表中表項的位置
找到2級頁表的表項之後,表項中記錄瞭該虛擬地址映射物理地址的起始地址,表項的大小是4字節32bit
根據找到的物理地址的起始地址結合虛擬地址的後12位作為偏移計算出最終的物理地址
x86架構 64位cpu
存在更多級頁表
全局頁目錄項 PGD(Page Global Directory上層頁目錄項 PUD(Page Upper Directory)中間頁目錄項 PMD(Page Middle Directory)頁表項 PTE(Page Table Entry)
線性地址尋址物理地址步驟
線性地址為48bit,最大物理地址為52bit,實際物理內存地址總線寬度是40bit,也就是支持1TB物理內存x86_64有四級頁表,原理同x86系統,也是一層層的尋址CR3寄存器保存最高層一級表的起始物理地址,因此尋址首先就是要獲取到CR3寄存器中的值每個PTE表項的大小是8個字節也就是64bit
TLB
在 CPU 芯片中,加入瞭一個專門存放程序最常訪問的頁表項的 Cache,這個 Cache 就是 TL(Translation Lookaside Buffer) 。通常稱為頁表緩存、轉址旁路緩存、快表等。那麼在CPU的內存管理單元MMU尋址時,會先查 TLB,如果沒找到,才會繼續查常規的頁表。
專有名詞
PDT:頁目錄表,多級頁表一級頁表,32bit系統有1024個頁目錄
PTT:頁表項表,多級頁表二級頁表,32bit系統有每個頁目錄下有1024個頁表項,每個表項4個字節
PDE:頁表的基址,是PDT中一項
PTE:是頁的基址,是PTT中一項
GDT:全局描述符表,邏輯地址轉為線性地址用到
LDT:局部描述符表,邏輯地址轉為線性地址用到
3.地址劃分
32系統
內核1G: 0xC0 00 00 01 – 0xFF FF FF FF
用戶3G: 0x00 00 00 00 – 0xC0 00 00 00
0xC0 00 00 00 == 3G
64位系統:
內核128T: 0xFF FF 80 00 00 00 00 00 – 0xFF FF FF FF FF FF FF FF (高位)
0xFF FF 7F FF FF FF FF FF – 0xFF FF FF FF FF FF FF FF(自己計算)
用戶128T: 0x00 00 00 00 00 00 00 00 – 0x00 00 7F FF FF FF FF FF (低位)
0x00 00 80 00 00 00 00 00 – 0x00 00 80 00 00 00 00 00 (自己計算)
0x00 00 7F FF FF FF FF FF == 127T
疑問:64位系統128T是分界線是127T?
訪問權限
進程在用戶態時,隻能訪問用戶空間內存
隻有進入內核態後,才可以訪問內核空間的內存
PAE機制
CPU位寬指的是一個時鐘周期內CPU能處理的二進制位數,普通場景中32位系統CPU的地址總線可以是32位,但是引入瞭PAE機制之後,16位CPU的地址總線位寬可以是20位(物理內存1M),32位CPU的地址總線可以是36位(物理內存64GB),64位CPU的地址總線位寬可以是40位(物理內存1TB)。因此我們不能簡單的說32位系統隻支持最大4GB的內存條。
4. 調試
程序寄存器
cs:是代碼段寄存器
ds:是數據段寄存器
ss:是堆棧段寄存器
es:是擴展段寄存器
fs:是標志段寄存器 32位之後才有
gs:是全局段寄存器 32位之後才有
示例一個內核宕機的日志:
RIP: 0010:[] [] xxxxxxxxxx+0x69/0x70
RSP: 0018:ffff886241737d98 EFLAGS: 00010246
RAX: ffff880034814d40 RBX: ffff881fc6248740 RCX: 0000000000000200
RDX: 0000000000000000 RSI: 0000000000000286 RDI: ffff881fc6381858
RBP: ffff886241737d98 R08: ffff886241734000 R09: 0000000000000000
R10: ffff880034814d40 R11: 0000000000000200 R12: ffff881fc62487a0
R13: 0000000000000000 R14: 00007fff86cb6260 R15: ffff881fc6381858
FS: 00007f78b59b8720(0000) GS:ffff885ffe3c0000(0000) knlGS:0000000000000000
CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
CR2: 00007f690a057180 CR3: 0000006208985000 CR4: 00000000003627e0
DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
DR3: 0000000000000000 DR6: 00000000fffe0ff0 DR7: 0000000000000400
查看程序寄存器
使用GDB隨意調試一個linux 32位上的ELF32的可執行文件,使用info r命令查看一下寄存器情況:
段寄存器有0x23和0x2b兩種情況:
十六進制:0023
二進制:0000000000100 0 11 – 段序號:4 – 表類型:GDT – 特權級:Ring3
十六進制:002B
二進制:0000000000101 0 11 – 段序號:5 – 表類型:GDT – 特權級:Ring3
段序號:從第四位開始 表類型:第三位 特權級:第1、2位
Linux下沒有找到可以直接用什麼命令或者工具查看GDT的方式,於是去源代碼中尋找答案:
看到瞭嗎,這兩項所描述的段和Windows一樣,基地址為0,大小為4GB。
Windows和Linux都選擇瞭通過這種方式架空瞭CPU的分段內存管理機制。
但需要說明一下的時,雖然兩個操作系統都是這種情況,但並不意味著段機制徹底沒用到,CPU的任務管理TSS還是需要用到,這一點大傢知道就行瞭,在linux64位系統下分段機制不被待見,但是操作系統仍然會保持先分段再分頁的尋址方式。
結語
到此這篇關於Linux內存管理和尋址詳細介紹的文章就介紹到這瞭,更多相關Linux內存管理和尋址內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!