探究C#訪問null字段會拋異常原因
一:舉例說明
namespace ConsoleApp2 { internal class Program { static Person person = null; static void Main(string[] args) { var age = person.age; Console.WriteLine(age); } } public class Person { public int age; } }
由於 person
是一個 null 對象,很顯然這段代碼會拋異常,那為什麼會拋異常呢?要想找原因,需要從最底層的匯編研究起。
二:異常原理分析
1. 從匯編上尋找答案
可以使用 Visual Studio 2022
的反匯編窗口,觀察 var age = person.age;
處到底生成瞭什麼。
—————- var age = person.age; —————-
081D6154 mov ecx,dword ptr ds:[4C41F4Ch]
081D615A mov ecx,dword ptr [ecx+4]
081D615D mov dword ptr [ebp-3Ch],ecx
這三句匯編還是很好理解的,4C41F4Ch
存放的是 person
對象, ecx+4
是取 person.age,最後一句就是將 age 放在 ebp-3Ch
棧位置上,接下來我們來看下 null 時的 ecx 到底是多少,截圖如下:
從圖中可以看到,此時的 ecx=0000000
,如果大傢瞭解 windows 的虛擬內存佈局,應該知道在虛擬內存的 0~0x0000ffff
范圍內是屬於 null 禁入區,凡是落在這個區一概屬訪問違例,畫個圖就像下面這樣。
到這裡原理就搞清楚瞭,因為 [ecx+4] = [4] 是落在這個 null 區所致, 但是。。。。 大傢有沒有發現一個問題,對,就是這裡的 [ecx+4]
,因為這裡有一個 +4
偏移來取 age 字段,那我能不能在 person 中多定義一些字段,然後取最後一個字段從而從 null 區
沖出去。。。哈哈。
2. 真的可以沖出 null 區嗎
有瞭這個想法之後,我決定在 Person
類中定義 10w 個 age 字段,參考代碼如下:
namespace ConsoleApp2 { internal class Program { static Person person = null; static void Main(string[] args) { var str = @"public class Person { {0} }"; var lines = Enumerable.Range(0, 100000).Select(m => $"public int age{m};"); var fields = string.Join("\n", lines); var txt = str.Replace("{0}", fields); File.WriteAllText("Person.cs", txt); Console.WriteLine("person.cs 生成完畢"); } } }
代碼執行後,Person.cs
就會如期生成,接下來讀取 person.age99999
看看有沒有奇跡發生,參考代碼如下:
internal class Program { static Person person = null; static void Main(string[] args) { var age = person.age99999; Console.WriteLine(age); } }
我去,萬萬沒想到,把 ClassLoader 給弄崩瞭。。。。得,那隻能改 20000 個 age 試試看吧,參考代碼如下:
internal class Program { static Person person = null; static void Main(string[] args) { var age = person.age19999; Console.WriteLine(age); } }
接下來我們將斷點放在 var age = person.age19999;
上繼續看反匯編代碼。
————- var age = person.age19999; ————-
0804657E mov ecx,dword ptr ds:[49F1F4Ch]
08046584 mov dword ptr [ebp-40h],ecx
08046587 mov ecx,dword ptr [ebp-40h]
0804658A cmp dword ptr [ecx],ecx
0804658C mov ecx,dword ptr [ebp-40h]
0804658F mov ecx,dword ptr [ecx+13880h]
08046595 mov dword ptr [ebp-3Ch],ecx
從上面的匯編代碼可以看出幾點信息。
- 匯編代碼行數多瞭。
- ecx+13880h 沖出瞭 null 區(FFFF) 的邊界。
接下來單步調試匯編,發現在 cmp dword ptr [ecx],ecx
處拋瞭異常。。。
大傢都知道此時的 ecx 的地址是 0 ,從 ecx
上取內容肯定會拋訪問違例,而且這段代碼很詭異,一般來說 cmp
之後都是類似 jz,jnz
跳轉指令,而它僅僅是個半殘之句。。。
從這些特征看,這是 JIT 故意在取偏移之前嘗試判斷 ecx
是不是 null,動機不純哈。。。。
三:總結
從這些分析中可以得知,JIT 還是很智能的。
- 當偏移值落在
0~FFFF
禁入區內,JIT 就不生成判斷代碼來減少代碼體積。 - 在偏移值沖出瞭
0~FFFF
禁入區,JIT 不得不生成代碼來判斷。
到此這篇關於探究C#訪問null字段會拋異常原因的文章就介紹到這瞭,更多相關C# null字段異常內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- C# List 並發丟數據問題原因及解決方案
- C#多態的三種實現方式(小結)
- C# 泛型List排序的實現
- C# NullReferenceException解決案例講解
- 一文帶你吃透C#中面向對象的相關知識