深入理解java.lang.String類的不可變性

1. 字符串 String 的不可變性

什麼是不可變類?

這樣理解:
        一個對象在創建完成後,不能去改變它的狀態,不能改變它的成員變量(如果成員變量包含基本數據類型,那麼這個基本數據類型的值不能改變;如果包含引用類型,那麼這個引用類型的變量不能指向別的對象)

不可變類隻是其實例不能被修改的類。每個實例中包含的所有信息都必須在創建該實例的時候就提供,並且在對象的整個生命周期內固定不變。為瞭使類不可變,要遵循下面五條規則:

  • 不要提供任何會修改對象狀態的方法
  • 保證類不會被擴展。 一般的做法是讓這個類稱為 final 的,防止子類化,破壞該類的不可變行為
  • 使所有的域都是 final 的
  • 使所有的域都成為私有的。 防止客戶端獲得訪問被域引用的可變對象的權限,並防止客戶端直接修改這些對象
  • 確保對於任何可變性組件的互斥訪問。 如果類具有指向可變對象的域,則必須確保該類的客戶端無法獲得指向這些對象的引用

翻閱 API 文檔:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    // value 數組被 final 修飾
    private final char value[];
    ...
}

String 類代表字符串。Java 程序中的所有字符串字面值(如 “abc” )都作為此類的實例來實現。 這些字面值都是直接存儲在“方法區”的 字符串常量池

字符串是常量;它們的值在創建之後 不能改變,所以可以共享它們。例如:

String str = "abc";

這時就有人疑惑瞭:為什麼 String 不可變?但我的代碼中經常改變 String 啊,如下:

String str = "HELLO";
str = "WORLD";
System.out.println(str);    // WORLD

這樣操作,不就是將 “HELLO” 對象改變成瞭 “WORLD” 對象瞭嗎?

雖然字符串的內容看上去從“HELLO” 變成瞭“WORLD”,但實際上,這已經是生成瞭一個新的字符串瞭:

String str = "HELLO";
System.out.println(str.hashCode());  // 68624562
str = "WORLD";
System.out.println(str.hashCode());  // 82781042

變量 str 前後的 hashCode 值不一樣,說明瞭 str 在改變前後,指向瞭不同的對象。所以,變量 str 隻是指向瞭不同對象,字符串 “HELLO”對象本身沒有被改變。

變量 str 的指向如下圖所示(jdk1.8:字符串常量位於堆中):

在這裡插入圖片描述

我們也可以使用 javap 命令來查看 class 的常量池:

javap -c -v StringTest.class

執行後,常量池信息如下:

在這裡插入圖片描述

從常量池中可以看出,確實有兩個字符串對象:HELLO、WORLD

【總結】:一旦一個 String 對象堆中被創建出來,它就無法被修改。而且,String 類的所有 API 方法都沒有改變字符串本身的值,都是返回瞭一個新的字符串對象。

2. String 設計成不可變類的好處

在瞭解瞭“String 是不可變”的之後,大傢是不是很疑惑:為什麼要把 String 設計成不可變的呢?這樣做又有什麼好處呢?

主要從以下幾個角度考慮:

  • 安全可靠性:字符串在 Java 應用程序中應用廣泛(存儲敏感信息,如:用戶名、密碼、連接 url、網絡連接等);JVM類加載器在加載類的時也廣泛地使用它。因此,保護 String 類對於提升整個應用程序的安全性至關重要。
  • 緩存:字符串是使用最廣泛的數據結構,大量的字符串的創建是非常耗費資源的。JVM 中專門開辟瞭一部分空間來存儲 Java 字符串,那就是字符串常量池。通過字符串常量池,兩個內容相同的字符串變量,可以從池中指向同一個字符串對象,從而節省瞭關鍵的內存資源
  • 線程安全:不可變會自動使字符串成為線程安全的,因為當從多個線程訪問它們時,它們不會被更改
  • hashcode 緩存:字符串也被廣泛地用於哈希實現,如 HashMap、HashTable、HashSet 等。在對這些散列實現進行操作時,經常調用鍵的hashCode() 方法。不可變性保證瞭字符串的值不會改變,因此,hashCode() 方法在 String 類中被重寫,以方便緩存。這樣,在第一次hashCode() 調用期間計算和緩存散列,並從那時起返回相同的值。

3. 面試題

// 生成兩個對象:一個在常量池中;一個中堆中,且都是 hello 對象
String s = new String("hello");

那麼,下面會生成幾個對象呢?

// 隻會在字符串常量池中生成一個對象:helloworld。
String s3 = "hello" + "world";

這種字面量用“+”拼接,編譯器在編譯期間會直接進行優化。

// 這個會生成4個對象。2個在常量池中:hello、world
// 2個在堆中:StringBuilder、helloworld對象
String s = "hello";
String s2 = s + "world";

編譯後,使用反編譯軟件 —— jad 進行查看:

String s1 = "hell0";
String s2 = (new StringBuilder()).append(s1).append("world").toString();

發現:使用“+”將變量和字面量進行拼接的結果是:將 String 轉成瞭StringBuilder 後,使用其 append() 方法進行處理的

查看 StringBuilder.toString() 方法源碼:

@Override
public String toString() {
	// char[] value; value 是 StringBuilder 類的成員變量
    return new String(value, 0, count);
}

最後調用 toString() 方法時,會創建一個 String 對象。這個字符串對象隻會在堆中創建,並不會在字符串常量池中創建。所以,會創建4個對象(hello 和 world 會直接在字符串常量池中創建)。

到此這篇關於深入理解java.lang.String類的不可變性的文章就介紹到這瞭,更多相關java.lang.String不可變性內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: