詳細圖解Java中字符串的初始化

前言

在深入學習字符串類之前,我們先搞懂JVM是怎樣處理新生字符串的。當你知道字符串的初始化細節後,再去寫String s = "hello"String s = new String("hello")等代碼時,就能做到心中有數。

首先得搞懂字符串常量池的概念,下面進入正文吧。

常量池

把經常用到的數據存放在某塊內存中,避免頻繁的數據創建與銷毀,實現數據共享,提高系統性能。

八種基礎數據類型除瞭float和double都實現瞭常量池技術。在近代的JDK版本中(1.7後),字符串常量池被實現在Java堆內存中。

下面通過三行代碼讓大傢對字符串常量池建立初步認識:

public static void main(String[] args) {
    String s1 = "hello";
    String s2 = new String("hello");
    System.out.println(s1 == s2);   //false
}

先來看看第一行代碼String s1 = “hello”;

直接通過雙引號( String s1 = “hello”)聲明字符串的方式,虛擬機首先會到字符串常量池中查找該字符串是否已經存在。如果存在會直接返回該引用,如果不存在則會在堆內存中創建該字符串對象,然後到字符串常量池中註冊該字符串。

上面的代碼中( String s1 = “hello”)虛擬機首先會到字符串常量池中查找是否有存在hello字符串對應的引用。發現沒有後會在堆內存創建hello字符串對象(內存地址0x0001),然後到字符串常量池中註冊地址為0x0001的hello對象,也就是添加指向0x0001的引用。最後把字符串對象返回給s1。

下面看String s2 = new String("hello");

當我們使用new關鍵字創建字符串對象的時候,JVM將不會查詢字符串常量池,它將會直接在堆內存中創建一個字符串對象,並返回給所屬變量。

所以s1和s2指向的是兩個完全不同的對象,判斷s1 == s2的時候會返回false。

再來看下面的示例:

public static void main(String[] args) {
    String s1 = new String("hello ") + new String("world");
    s1.intern();
    String s2 = "hello world";
    System.out.println(s1 == s2);   //true
}

第一行代碼String s1 = new String("hello ") + new String("world");的執行過程是這樣子的:

  1. 依次在堆內存中創建hello和world兩個字符串對象;
  2. 然後把它們拼接起來 (底層使用StringBuilder實現);
  3. 在拼接完成後會產生新的hello world對象,這時變量s1指向新對象hello world。

執行完第一行代碼後,內存是這樣子的:

第二行代碼s1.intern();

當調用intern()方法時,首先會去常量池中查找是否有該字符串對應的引用,如果有就直接返回該字符串;

如果沒有,就會在常量池中註冊該字符串的引用,然後返回該字符串。

由於第一行代碼采用的是new的方式創建字符串,所以在字符串常量池中沒有保存hello world對應的引用,虛擬機會在常量池中進行註冊,註冊完後的內存示意圖如下:

第三行代碼String s2 = "hello world";

首先虛擬機會去檢查字符串常量池,發現有指向hello world的引用。然後把該引用所指向的字符串直接返回給所屬變量。

執行完第三行代碼後,內存示意圖如下:

如圖所示,s1和s2指向的是相同的對象,所以當判斷s1 == s2時返回true。

總結:

  • 當用new關鍵字創建字符串對象時,不會查詢字符串常量池;
  • 當用雙引號直接聲明字符串對象時,虛擬機將會查詢字符串常量池。

說白瞭就是:字符串常量池提供瞭字符串的復用功能,除非我們要顯式創建新的字符串對象,否則對同一個字符串虛擬機隻會維護一份拷貝。

反編譯代碼驗證字符串初始化操作

下面我們再來看一個示例:

public class Main {
    public static void main(String[] args) {
        String s1 = "hello ";
        String s2 = "world";
        String s3 = s1 + s2;
        String s4 = "hello world";
        System.out.println(s3 == s4);
    }
}

首先第一行和第二行是常規的字符串對象聲明,它們分別會在堆內存創建字符串對象,並會在字符串常量池中進行註冊。

影響我們做出判斷的是第三行代碼String s3 = s1 + s2;,我們不知道s1 + s2在創建完新字符串hello world後是否會在字符串常量池進行註冊。

簡單點說:我們不知道這行代碼是以雙引號形式聲明字符串,還是用new關鍵字創建字符串。

那麼我們看下這端代碼的反編譯後的代碼:

PS D:\code\javaSE\target\classes\demo> javap -c .\Main.class
Compiled from "Main.java"
public class demo.Main {
  public demo.Main();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: ldc           #2                  // String hello
       2: astore_1
       3: ldc           #3                  // String world
       5: astore_2
       6: new           #4                  // class java/lang/StringBuilder
       9: dup
      10: invokespecial #5                  // Method java/lang/StringBuilder."<init>":()V
      13: aload_1
      14: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      17: aload_2
      18: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      21: invokevirtual #7                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      24: astore_3
      25: ldc           #8                  // String hello world
      27: astore        4
      29: getstatic     #9                  // Field java/lang/System.out:Ljava/io/PrintStream;
      32: aload_3
      33: aload         4
      35: if_acmpne     42
      38: iconst_1
      39: goto          43
      42: iconst_0
      43: invokevirtual #10                 // Method java/io/PrintStream.println:(Z)V
      46: return
}

直接看重點:

  • 21: invokevirtual #7 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
  • 24: astore_3
  • 虛擬機調用StringBuilder的toString()方法獲得字符串hello world,並存放至s3。

下面是我們追蹤StringBuilder的toString()方法源碼:

@Override
public String toString() {
    // Create a copy, don't share the array
    return new String(value, 0, count);
}

通過以上源碼可以看出:s3是通過new關鍵字獲得字符串對象的。

回到題目,也就是說字符串常量表中沒有存儲hello world的引用,當s4以引號的形式聲明字符串時,由於在字符串常量池中查不到相應的引用,所以會在堆內存中新創建一個字符串對象。 所以s3和s4指向的不是同一個字符串對象, 結果為false。

總結

到此這篇關於Java中字符串初始化的文章就介紹到這瞭,更多相關Java字符串的初始化內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: