Java求餘%操作引發的一連串故事

操作符%通常用在正整數上,但同樣可以用在負整數和浮點數上。
  註意:隻有當被除數是負數時, 餘數才是負的。

C1 RCE對%的處理

HotSpot VM的C1有個RCE(Range Check Elimination,范圍檢查消除)優化,所謂范圍檢查消除,就是為瞭正確的拋出數組越界異常,虛擬機需要在數組訪問的一些地方插入隱式的檢查,但是這些檢查會降低性能,比如在循環中每次循環都得檢查一次,所以HotSpot VM會想辦法在可能的地方消除這些檢查。我在看C1 RCE的時候發現目前它對求餘符號的支持較為薄弱,它隻能處理形如下面的代碼:

arr[x%arr.length] // 隻有除數是x.length的時候,才能應用RCE優化

如果餘數是整數常量,它就不能工作瞭:

arr[x%3]
for(int i=0;i<10;i++){
  arr[x%10]
}

實際上,根據JLS的定義,我們知道如果除數為整數常量(且等於零,因為0作為除數會拋出運行時異常),是可以推導出結果的上下界的(也取決於被除數的正負),規則如下:

  • x % -y ==> [0, y – 1]
  • x % y ==> [0, y – 1]
  • -x % y ==> [-y + 1, 0]
  • -x % -y ==> [-y + 1, 0]

於是,我給JDK發瞭個patch,這個問題算是解決瞭。但是Nils提到,C2是否有相同的優化呢?後面Tobias幫忙確認瞭一下C2沒有,我再後來也進一步確認瞭,所以下一步是調研C2是否能應用同樣的優化。

調研為C2應用同樣的優化

本來以為是比較trivial的事情,為求餘節點的類型系統加點代碼,推導一下上下界即可,實際上我也這麼做的,但是最後發現這樣沒有消除上下界。默認開啟-XX:+GenerateRangeChecks後,在數組訪問過程中(Parse::array_addressing),C2仍然生成瞭范圍檢查。

調試後發現推導上下界根本沒有執行,因為C2創建完求餘節點後,會執行一個IGVN的過程,即迭代的應用多種優化,其中就包括理想化,C2理想化是指應用很多局部小優化的過程,在這個例子中就是特殊處理形如x%2^n,x%2^n-1x%1的情況,如果除數是整數常量,它還會使用一個來自https://book.douban.com/subject/1784887/書裡面的算法,即Division by Invariant Integers using Multiplication(by Granlund and Montgomery),搜瞭一下知乎有類似的文章,想要瞭解細節可以讀讀https://zhuanlan.zhihu.com/p/151038723。知道瞭原因,於是我改瞭下代碼,禁止瞭求餘節點的理想化,心想這總可以瞭吧。

還是不行

是的,還是不行。盡管我已經禁止瞭對求餘符號的理想化優化,但是范圍檢查還是生成瞭。。。我又繼續看代碼,發現除瞭理想化的這個優化之外,C2在IR(中間表示)構造的過程中又 又 又 又 又對求餘運算做瞭個優化!如果除數是正整數常量,且是2^n,那麼C2會對它進行變形,IR如圖所示:

左邊的IR是 IR構造的時候C2做的優化後的效果,右邊是理想化優化後的效果。實際上它們做的事情本身是比較重復的,而且經過測試發現,理想化優化的算法要好於IR構造過程中的優化,所以我又提瞭個patch解決這個問題(不過還在review中)。

結語

我認為為求餘節點推導上下界也是有意義的,如果以後有其他優化會變形為求餘運算,那麼它們可以應用這個推導,同時,為求餘做統一完善的類型推導這件事本身也是正確的,所以我又提瞭個patch。可以看到,最終我隻消除瞭C1 arr[x%4]的范圍檢查,還是沒能消除C2 arr[x%4]的范圍檢查,是不是以後可以說C1有的地方做的比C2好瞭(狗頭hh。

以上就是Java求餘%操作引發的一連串故事的詳細內容,更多關於Java求餘%的資料請關註WalkonNet其它相關文章!

推薦閱讀: