詳解Java編譯優化之循環展開和粗化鎖
循環展開和粗化鎖
我們先來回顧一下什麼是循環展開。
循環展開就是說,像下面的循環遍歷的例子:
for (int i = 0; i < 1000; i++) { x += 0x51; }
因為每次循環都需要做跳轉操作,所以為瞭提升效率,上面的代碼其實可以被優化為下面的:
for (int i = 0; i < 250; i++) { x += 0x144; //0x51 * 4 }
註意上面我們使用的是16進制數字,至於為什麼要使用16進制呢?這是為瞭方便我們在後面的assembly代碼中快速找到他們。
好瞭,我們再在 x += 0x51 的外面加一層synchronized鎖,看一下synchronized鎖會不會隨著loop unrolling展開的同時被粗化。
for (int i = 0; i < 1000; i++) { synchronized (this) { x += 0x51; } }
萬事具備,隻欠我們的運行代碼瞭,這裡我們還是使用JMH來執行。
相關代碼如下:
@Warmup(iterations = 10, time = 1, timeUnit = TimeUnit.SECONDS) @Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS) @Fork(value = 1, jvmArgsPrepend = { "-XX:-UseBiasedLocking", "-XX:CompileCommand=print,com.flydean.LockOptimization::test" } ) @State(Scope.Benchmark) @BenchmarkMode(Mode.AverageTime) @OutputTimeUnit(TimeUnit.NANOSECONDS) public class LockOptimization { int x; @Benchmark @CompilerControl(CompilerControl.Mode.DONT_INLINE) public void test() { for (int i = 0; i < 1000; i++) { synchronized (this) { x += 0x51; } } } public static void main(String[] args) throws RunnerException { Options opt = new OptionsBuilder() .include(LockOptimization.class.getSimpleName()) .build(); new Runner(opt).run(); } }
上面的代碼中,我們取消瞭偏向鎖的使用:-XX:-UseBiasedLocking。為啥要取消這個選項呢?因為如果在偏向鎖的情況下,如果線程獲得鎖之後,在之後的執行過程中,如果沒有其他的線程訪問該鎖,那麼持有偏向鎖的線程則不需要觸發同步。
為瞭更好的理解synchronized的流程,這裡我們將偏向鎖禁用。
其他的都是我們之前講過的JMH的常規操作。
接下來就是見證奇跡的時刻瞭。
分析Assembly日志
我們運行上面的程序,將會得到一系列的輸出。因為本文並不是講解Assembly語言的,所以本文隻是大概的理解一下Assembly的使用,並不會詳細的進行Assembly語言的介紹,如果有想深入瞭解Assembly的朋友,可以在文後留言。
分析Assembly的輸出結果,我們可以看到結果分為C1-compiled nmethod和C2-compiled nmethod兩部分。
先看C1-compiled nmethod:
第一行是monitorenter,表示進入鎖的范圍,後面還跟著對於的代碼行數。
最後一行是monitorexit,表示退出鎖的范圍。
中間有個add $0x51,%eax操作,對於著我們的代碼中的add操作。
可以看到C1—compiled nmethod中是沒有進行Loop unrolling的。
我們再看看C2-compiled nmethod:
和C1很類似,不同的是add的值變成瞭0x144,說明進行瞭Loop unrolling,同時對應的鎖范圍也跟著進行瞭擴展。
最後看下運行結果:
Benchmark Mode Cnt Score Error Units
LockOptimization.test avgt 5 5601.819 ± 620.017 ns/op
得分還不錯。
禁止Loop unrolling
接下來我們看下如果將Loop unrolling禁掉,會得到什麼樣的結果。
要禁止Loop unrolling,隻需要設置-XX:LoopUnrollLimit=1即可。
我們再運行一下上面的程序:
可以看到C2-compiled nmethod中的數字變成瞭原本的0x51,說明並沒有進行Loop unrolling。
再看看運行結果:
Benchmark Mode Cnt Score Error Units
LockOptimization.test avgt 5 20846.709 ± 3292.522 ns/op
可以看到運行時間基本是優化過後的4倍左右。說明Loop unrolling還是非常有用的。
以上就是詳解Java編譯優化之循環展開和粗化鎖的詳細內容,更多關於Java編譯優化之循環展開和粗化鎖的資料請關註WalkonNet其它相關文章!