詳解Java編譯優化之循環展開和粗化鎖

Posted on 2021-06-02 by WalkonNet

循環展開和粗化鎖

我們先來回顧一下什麼是循環展開。

循環展開就是說，像下面的循環遍歷的例子：

for (int i = 0; i < 1000; i++) {
    x += 0x51;
}

因為每次循環都需要做跳轉操作，所以為瞭提升效率，上面的代碼其實可以被優化為下面的：

for (int i = 0; i < 250; i++) {
    x += 0x144; //0x51 * 4
}

註意上面我們使用的是16進制數字，至於為什麼要使用16進制呢？這是為瞭方便我們在後面的assembly代碼中快速找到他們。

好瞭，我們再在 x += 0x51 的外面加一層synchronized鎖，看一下synchronized鎖會不會隨著loop unrolling展開的同時被粗化。

for (int i = 0; i < 1000; i++) {
    synchronized (this) {
        x += 0x51;
    }
}

萬事具備，隻欠我們的運行代碼瞭，這裡我們還是使用JMH來執行。

相關代碼如下：

@Warmup(iterations = 10, time = 1, timeUnit = TimeUnit.SECONDS)
@Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS)
@Fork(value = 1,
        jvmArgsPrepend = {
        "-XX:-UseBiasedLocking",
                "-XX:CompileCommand=print,com.flydean.LockOptimization::test"
}
        )
@State(Scope.Benchmark)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
public class LockOptimization {

    int x;
    @Benchmark
    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void test() {
        for (int i = 0; i < 1000; i++) {
            synchronized (this) {
                x += 0x51;
            }
        }
    }

    public static void main(String[] args) throws RunnerException {
        Options opt = new OptionsBuilder()
                .include(LockOptimization.class.getSimpleName())
                .build();
        new Runner(opt).run();
    }
}

上面的代碼中，我們取消瞭偏向鎖的使用：-XX:-UseBiasedLocking。為啥要取消這個選項呢？因為如果在偏向鎖的情況下，如果線程獲得鎖之後，在之後的執行過程中，如果沒有其他的線程訪問該鎖，那麼持有偏向鎖的線程則不需要觸發同步。

為瞭更好的理解synchronized的流程，這裡我們將偏向鎖禁用。

其他的都是我們之前講過的JMH的常規操作。

接下來就是見證奇跡的時刻瞭。

分析Assembly日志

我們運行上面的程序，將會得到一系列的輸出。因為本文並不是講解Assembly語言的，所以本文隻是大概的理解一下Assembly的使用，並不會詳細的進行Assembly語言的介紹，如果有想深入瞭解Assembly的朋友，可以在文後留言。

分析Assembly的輸出結果，我們可以看到結果分為C1-compiled nmethod和C2-compiled nmethod兩部分。

先看C1-compiled nmethod：

第一行是monitorenter,表示進入鎖的范圍，後面還跟著對於的代碼行數。

最後一行是monitorexit,表示退出鎖的范圍。

中間有個add $0x51,%eax操作，對於著我們的代碼中的add操作。

可以看到C1—compiled nmethod中是沒有進行Loop unrolling的。

我們再看看C2-compiled nmethod:

和C1很類似，不同的是add的值變成瞭0x144,說明進行瞭Loop unrolling，同時對應的鎖范圍也跟著進行瞭擴展。

最後看下運行結果：

Benchmark Mode Cnt Score Error Units

LockOptimization.test avgt 5 5601.819 ± 620.017 ns/op

得分還不錯。

禁止Loop unrolling

接下來我們看下如果將Loop unrolling禁掉，會得到什麼樣的結果。

要禁止Loop unrolling，隻需要設置-XX:LoopUnrollLimit=1即可。

我們再運行一下上面的程序:

可以看到C2-compiled nmethod中的數字變成瞭原本的0x51，說明並沒有進行Loop unrolling。

再看看運行結果：

Benchmark Mode Cnt Score Error Units

LockOptimization.test avgt 5 20846.709 ± 3292.522 ns/op

可以看到運行時間基本是優化過後的4倍左右。說明Loop unrolling還是非常有用的。

以上就是詳解Java編譯優化之循環展開和粗化鎖的詳細內容，更多關於Java編譯優化之循環展開和粗化鎖的資料請關註WalkonNet其它相關文章！

詳解Java編譯優化之循環展開和粗化鎖

循環展開和粗化鎖

分析Assembly日志

禁止Loop unrolling

推薦閱讀：

發佈留言取消回覆

近期文章

循環展開和粗化鎖

分析Assembly日志

禁止Loop unrolling

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆