搞懂JAVAObject中的hashCode()

Posted on 2021-08-12 by WalkonNet

Object中的hashCode()

hashCode方法用來返回對象的哈希值，提供該方法是為瞭支持哈希表，例如HashMap，HashTable等，在Object類中的代碼如下:

 public native int hashCode();

這是一個native聲明的本地方法，返回一個int型的整數。由於在Object中，因此每個對象都有一個默認的哈希值。

在openjdk8根路徑/hotspot/src/share/vm/runtime路徑下的synchronizer.cpp文件中,有生成哈希值的代碼：

static inline intptr_t get_next_hash(Thread * Self, oop obj) {
  intptr_t value = 0 ;
  if (hashCode == 0) {
     // 返回隨機數
     value = os::random() ;
  } else
  if (hashCode == 1) {
     //用對象的內存地址根據某種算法進行計算
     intptr_t addrBits = cast_from_oop<intptr_t>(obj) >> 3 ;
     value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
  } else
  if (hashCode == 2) {
     // 始終返回1，用於測試
     value = 1 ;            
  } else
  if (hashCode == 3) {
     //從0開始計算哈希值
     value = ++GVars.hcSequence ;
  } else
  if (hashCode == 4) {
     //輸出對象的內存地址
     value = cast_from_oop<intptr_t>(obj) ;
  } else {
     // 默認的hashCode生成算法，利用xor-shift算法產生偽隨機數
     unsigned t = Self->_hashStateX ;
     t ^= (t << 11) ;
     Self->_hashStateX = Self->_hashStateY ;
     Self->_hashStateY = Self->_hashStateZ ;
     Self->_hashStateZ = Self->_hashStateW ;
     unsigned v = Self->_hashStateW ;
     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
     Self->_hashStateW = v ;
     value = v ;
  }

  value &= markOopDesc::hash_mask;
  if (value == 0) value = 0xBAD ;
  assert (value != markOopDesc::no_hash, "invariant") ;
  TEVENT (hashCode: GENERATE) ;
  return value;
}

源碼中的hashCode其實是JVM啟動的一個參數，每一個分支對應一個生成策略，通過-XX:hashCode可以切換hashCode的生成策略。

下面驗證第2種生成策略，用軟件idea輸入參數-XX:hashCode=2，可以看到輸出結果正是1，從而進一步驗證瞭上面的源碼。

在這裡插入圖片描述

hashCode()和equals()

hashCode()和equals()用來標識對象，兩個方法協同工作用來判斷兩個對象是否相等。對象通過調用 Object.hashCode（）生成哈希值，由於不可避免地會存在哈希值沖突的情況因此hashCode 相同時還需要再調用 equals 進行一次值的比較，但是若hashCode不同，將直接判定兩個對象不同，跳過 equals ，這加快瞭沖突處理效率。 Object 類定義中對 hashCode和 equals 要求如下:

如果兩個對象的equals的結果是相等的，則兩個對象的 hashCode 的返回結果也必須是相同的。
任何時候重寫equals，都必須同時重寫hashCode。

下面看一個小例子:

import java.util.HashMap;
import java.util.Objects;

/**
 * @author mazouri
 * @create 2021-08-10 23:59
 */
public class Person {
    //用戶Id，唯一確定用戶
    private String id;
    private String name;

    public Person(String id, String name) {
        this.id = id;
        this.name = name;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (!(o instanceof Person)) return false;
        Person person = (Person) o;
        return Objects.equals(id, person.id) && Objects.equals(name, person.name);
    }

    public static void main(String[] args) {
        HashMap<Person, Integer> map = new HashMap<>();
        //key:Person類型  value:Integer類型
        map.put(new Person("1","張三"),100);
        System.out.println(map.get(new Person("1", "張三")));
    }
}

我們將Person類的實例作為key，value為這個對象的考試成績。我們期望通過map.get(new Person(“1”, “張三”))獲取該對象的考試成績，但上面代碼的輸出結果為null。原因就在於Person類中沒有覆蓋hashCode方法，從而導致兩個相等的實例具有不同的哈希值。HashMap中get()的核心代碼如下

if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
     return first;

if條件表達式中的e.hash == hash是先決條件，隻有相等才會執行&&後面的代碼。equals不相等時並不強制要求哈希值相等，但是一個優秀的哈希算法應盡可能讓元素均勻分佈，降低沖突發生的概率，即在equals不相等時盡量讓哈希值也不相等，這樣&&或||短路操作一旦生效，會極大提高程序的效率。像上面的例子，因為沒有重寫hashCode方法，兩個對象有兩個哈希值，獲取對象時可能在別的哈希桶中查找，即使湊巧在一個哈希桶，因為哈希值不一樣，也找不到原來那一個對象。
你可以根據你自己的需求設計重寫hashCode方法，或者調用JDK提供好的，比如

  @Override
    public int hashCode() {
        return Objects.hash(id, name);
    }

這樣就能解決問題，但是這個運行速度慢一些，因為它們會引發數組的創建，以便傳入數目可變的參數，如果參數中有基本類型，還需要裝箱和拆箱，建議隻將這類散列函數用於不太註重性能的情況。

重寫的hashCode()方法

Java為許多常用的數據類型重寫瞭hashCode()方法，比如String，Integer，Double等。比如在Integer類中哈希值就是其int類型的數據。

  public static int hashCode(int value) {
        return value;
    }

總結

本篇文章就到這裡瞭，希望能給你帶來幫助，也希望您能夠多多關註WalkonNet的更多內容！

搞懂JAVAObject中的hashCode()

目錄

Object中的hashCode()

hashCode()和equals()

重寫的hashCode()方法

總結

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

Object中的hashCode()

hashCode()和equals()

重寫的hashCode()方法

總結

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆