詳細圖解Java中字符串的初始化

Posted on 2021-08-29 by WalkonNet

前言

在深入學習字符串類之前，我們先搞懂JVM是怎樣處理新生字符串的。當你知道字符串的初始化細節後，再去寫String s = "hello"或String s = new String("hello")等代碼時，就能做到心中有數。

首先得搞懂字符串常量池的概念，下面進入正文吧。

常量池

把經常用到的數據存放在某塊內存中，避免頻繁的數據創建與銷毀，實現數據共享，提高系統性能。

八種基礎數據類型除瞭float和double都實現瞭常量池技術。在近代的JDK版本中(1.7後)，字符串常量池被實現在Java堆內存中。

下面通過三行代碼讓大傢對字符串常量池建立初步認識：

public static void main(String[] args) {
    String s1 = "hello";
    String s2 = new String("hello");
    System.out.println(s1 == s2);   //false
}

先來看看第一行代碼String s1 = “hello”;

直接通過雙引號（ String s1 = “hello”）聲明字符串的方式，虛擬機首先會到字符串常量池中查找該字符串是否已經存在。如果存在會直接返回該引用，如果不存在則會在堆內存中創建該字符串對象，然後到字符串常量池中註冊該字符串。

上面的代碼中（ String s1 = “hello”）虛擬機首先會到字符串常量池中查找是否有存在hello字符串對應的引用。發現沒有後會在堆內存創建hello字符串對象(內存地址0x0001)，然後到字符串常量池中註冊地址為0x0001的hello對象，也就是添加指向0x0001的引用。最後把字符串對象返回給s1。

下面看String s2 = new String("hello");

當我們使用new關鍵字創建字符串對象的時候，JVM將不會查詢字符串常量池，它將會直接在堆內存中創建一個字符串對象，並返回給所屬變量。

所以s1和s2指向的是兩個完全不同的對象，判斷s1 == s2的時候會返回false。

再來看下面的示例：

public static void main(String[] args) {
    String s1 = new String("hello ") + new String("world");
    s1.intern();
    String s2 = "hello world";
    System.out.println(s1 == s2);   //true
}

第一行代碼String s1 = new String("hello ") + new String("world");的執行過程是這樣子的：

依次在堆內存中創建hello和world兩個字符串對象；
然後把它們拼接起來 (底層使用StringBuilder實現)；
在拼接完成後會產生新的hello world對象，這時變量s1指向新對象hello world。

執行完第一行代碼後，內存是這樣子的：

第二行代碼s1.intern();

當調用intern()方法時，首先會去常量池中查找是否有該字符串對應的引用，如果有就直接返回該字符串；

如果沒有，就會在常量池中註冊該字符串的引用，然後返回該字符串。

由於第一行代碼采用的是new的方式創建字符串，所以在字符串常量池中沒有保存hello world對應的引用，虛擬機會在常量池中進行註冊，註冊完後的內存示意圖如下：

第三行代碼String s2 = "hello world";

首先虛擬機會去檢查字符串常量池，發現有指向hello world的引用。然後把該引用所指向的字符串直接返回給所屬變量。

執行完第三行代碼後，內存示意圖如下：

如圖所示，s1和s2指向的是相同的對象，所以當判斷s1 == s2時返回true。

總結：

當用new關鍵字創建字符串對象時，不會查詢字符串常量池；
當用雙引號直接聲明字符串對象時，虛擬機將會查詢字符串常量池。

說白瞭就是：字符串常量池提供瞭字符串的復用功能，除非我們要顯式創建新的字符串對象，否則對同一個字符串虛擬機隻會維護一份拷貝。

反編譯代碼驗證字符串初始化操作

下面我們再來看一個示例：

public class Main {
    public static void main(String[] args) {
        String s1 = "hello ";
        String s2 = "world";
        String s3 = s1 + s2;
        String s4 = "hello world";
        System.out.println(s3 == s4);
    }
}

首先第一行和第二行是常規的字符串對象聲明，它們分別會在堆內存創建字符串對象，並會在字符串常量池中進行註冊。

影響我們做出判斷的是第三行代碼String s3 = s1 + s2;，我們不知道s1 + s2在創建完新字符串hello world後是否會在字符串常量池進行註冊。

簡單點說：我們不知道這行代碼是以雙引號形式聲明字符串，還是用new關鍵字創建字符串。

那麼我們看下這端代碼的反編譯後的代碼：

PS D:\code\javaSE\target\classes\demo> javap -c .\Main.class
Compiled from "Main.java"
public class demo.Main {
  public demo.Main();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: ldc           #2                  // String hello
       2: astore_1
       3: ldc           #3                  // String world
       5: astore_2
       6: new           #4                  // class java/lang/StringBuilder
       9: dup
      10: invokespecial #5                  // Method java/lang/StringBuilder."<init>":()V
      13: aload_1
      14: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      17: aload_2
      18: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      21: invokevirtual #7                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      24: astore_3
      25: ldc           #8                  // String hello world
      27: astore        4
      29: getstatic     #9                  // Field java/lang/System.out:Ljava/io/PrintStream;
      32: aload_3
      33: aload         4
      35: if_acmpne     42
      38: iconst_1
      39: goto          43
      42: iconst_0
      43: invokevirtual #10                 // Method java/io/PrintStream.println:(Z)V
      46: return
}

直接看重點：

21: invokevirtual #7 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
24: astore_3
虛擬機調用StringBuilder的toString()方法獲得字符串hello world，並存放至s3。

下面是我們追蹤StringBuilder的toString()方法源碼：

@Override
public String toString() {
    // Create a copy, don't share the array
    return new String(value, 0, count);
}

通過以上源碼可以看出：s3是通過new關鍵字獲得字符串對象的。

回到題目，也就是說字符串常量表中沒有存儲hello world的引用，當s4以引號的形式聲明字符串時，由於在字符串常量池中查不到相應的引用，所以會在堆內存中新創建一個字符串對象。所以s3和s4指向的不是同一個字符串對象，結果為false。

總結

到此這篇關於Java中字符串初始化的文章就介紹到這瞭,更多相關Java字符串的初始化內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

詳細圖解Java中字符串的初始化

目錄

前言

常量池

反編譯代碼驗證字符串初始化操作

總結

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

前言

常量池

反編譯代碼驗證字符串初始化操作

總結

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆