Java內存模型之重排序的相關知識總結

一、數據依賴性

如果兩個操作訪問同一個變量,而且這兩個操作中有一個操作為寫操作,此時這兩個操作之間存在數據依賴性。數據依賴性分為三種,如表所示:

名稱 代碼示例 說明
寫後讀 a=1;b=a; 寫一個變量後,再讀這個位置
寫後寫 a=1;a=2; 寫一個變量後,在寫這個變量
讀後寫 a=b;b=1; 讀一個變量後,再寫這個變量

上面的這三種情況,隻要重排序瞭兩個操作的執行順序,程序的執行結果就會被改變。編譯器和處理器針對單個處理器中執行的指令序列和單個線程中執行的操作重排序時,會遵守數據依賴性,編譯器和處理器不會改變存在數據依賴關系的兩個操作的執行順序。(不同處理器和不同線程之間的數據依賴性不被編譯器和處理器考慮)。

二、as-if-serial語義

as-if-serial語義指的是:不管怎麼重排序,單線程執行程序的執行結果不能被改變。編譯器、runtime和處理器都必須遵守as-if-serial語義。

為瞭遵守as-if-serial語義,編譯器和處理器不會對存在數據依賴關系的操作做重排序,因為 這種重排序會改變執行結果。但是,如果操作之間不存在數據依賴關系,這些操作就可能被編譯器和處理器重排序。

舉例說明,計算圓面積的代碼示例:

double pi = 3.14;			//	A
double r = 1.0;				//	B
double area = pi * r;		//	C

上面3個操作的數據依賴關系如下所示:

在這裡插入圖片描述

3個操作之間的依賴關系

解釋:A和B之間存在數據依賴關系,同時B和C之間也存在數據依賴關系。因此在最終執行的指令序列中,C不可能被排到A和B的前面(C排到A和B的前面,程序的結果將會被改變)。但A和B之間沒有數據依賴關系,編譯器和處理器可重排序A和B之間的執行順序。

重排序後存在如下的執行可能:

在這裡插入圖片描述

總結:as-if-serial語義吧單線程程序保護起來瞭,遵守as-if-serial語義的編譯器、runtime和處理器共同為編寫單線程程序的程序員創建瞭一個錯誤的幻覺單線程程序是按程序的順序來執行的。as-if-serial語義使單線程程序員無需擔心重排序會幹擾他們,也無需擔心內存可見性問題。

三、程序順序規則

根據happens-before的程序規則,上面計算圓的面積的示例代碼存在3個happens-before關系。

1.A happens-before B

2.B happens-before C

3.A happens-before C

A happens-before C是根據1和2推導出來的。

雖然A happens-before B但是實際執行時B卻可以排在A前面執行(在上面的執行圖中)。如果A happens-before B,JMM並不要求A一定要在B之前執行,JMM僅僅要求前一個操作(執行的結果)對後一個操作可見,且前一個操作按順序排在第二個操作之前。這裡A的執行結果不需要對B可見;而且重排序操作A和操作B後的執行結果,與A和操作B按happens-before順序執行的結果一致。在這種情況下,JMM會認為這種重排序並不非法(not illegal),JMM運行這種重排序。
在計算機中,軟件技術和硬件技術有一個共同目標:再不改變程序執行結果的前提下,盡可能提高並行度。編譯器和處理區遵從這一目標,從happens-before的定義我們可以看出,JMM同樣也遵循這一目標。

四、重排序對多線程的影響

重排序是否會影響多線程的執行結果呢?

package com.lizba.p1;

/**
 * <p>
 *
 * </p>
 *
 * @Author: Liziba
 * @Date: 2021/6/7 23:01
 */
public class ReorderExample {

    // 定義變量a
    int a = 0;
    // flag變量是個標記,用來標志變量a是否被寫入
    boolean flag = false;

    public void writer() {
        a = 1;                           // 1
        flag = true;                     // 2
    }

    public void reader() {
        if (flag) {                      // 3
            int i = a * a;               // 4
            System.out.println("i:" + i);
        }
    }


    /**
     * 測試
     * 
     * @param args
     */
    public static void main(String[] args) {

        final ReorderExample re = new ReorderExample();

        new Thread() {
            public void run() {
                re.writer();
            }
        }.start();

        new Thread() {
            public void run() {
                re.reader();
            }
        }.start();
    }

}

這裡假設兩個線程A和B,A首先執行write(),B再執行readr()。線程B在執行操作4時,能否看到線程A在操作1對共享變量a的寫入呢?

答案是:不一定能!
由於操作1和操作2沒有數據依賴關系,編譯器和處理器可以對這兩個操作重排序;同樣,操作3和操作4沒有數據依賴關系,編譯器和處理器也可以多這兩個操作重排序。

假設操作1和操作2重排序:(虛箭線代表錯誤的讀操作)

在這裡插入圖片描述

程序執行時序圖

如上圖操作1和操作2發生瞭重排序。程序執行時,線程A首先寫標記變量flag,隨後線程B讀取這個變量,條件判斷為真,線程B讀取變量a的值。此時,變量a還沒有被線程A寫入,在這裡多線程程序的語義被重排序破壞瞭。

設操作3和操作4重排序:

在這裡插入圖片描述

程序執行時序圖

在上述執行方式的程序中,操作3和操作4存在控制依賴關系。當代碼中存在控制依賴性時,會影響指令並行度。為此編譯器和處理器會采用猜測(Speculation)執行來克服控制相關性對並行度的影響。以處理器的猜測執行為例,執行現場B的處理器可提前讀取並行計算a*a,然後計算結果保存到一個名為重排序緩沖(Recorder Buffer, ROB)的硬件緩存中。當操作3的條件判斷為真時,就把計算結果寫入變量i中。
在上圖中可以看出,猜測執行實質上對操作3和4做瞭重排序。重排序在這裡破壞瞭多線程程序的語義!
在單線程程序中,對存在控制依賴性的操作重排序,不會改變執行結果(這也是as-if-serial語義允許對存在控制依賴的操作做重排序的原因);但是在多線程中,對存在控制依賴的操作重排序,可能會改變程序的執行結果。

到此這篇關於Java內存模型之重排序的相關知識總結的文章就介紹到這瞭,更多相關Java重排序內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: