Java字符串的intern方法有何奧妙之處

學習背景

進入正文學習字符串的intern()方法之前,先給下這4個問題,看下自己是否都知道答案?

1、String s1 = “a” + “b”; //創建瞭幾個對象?
2、String s2 = new String(“ab”); //創建瞭幾個對象?
3、String s3 = new String(“a”) + new String(“b”); //創建瞭幾個對象?
4、String s4= new String(“a”) + new String(“a”); s4.intern(); //創建瞭幾個對象?

如果都清楚,恭喜你,大佬一枚,不用往下學習瞭,哈哈哈!
那如果不太確定或者需要加深自己的理解,建議進入正文一起來瞭解下吧!
當然,也可以拉到最後有答案!

String#intern()示例代碼

先來執行一下String調用intern()方法的一段示例代碼:

public class StringInternTest {
    public static void main(String[] args) {
        String reference1 = new String("a");
        reference1.intern();
        String reference2 = "a";
        System.out.println(reference1 == reference2);

        String reference3 = new String("a") + new String("a");
        reference3.intern();
        String reference4 = "aa";
        System.out.println(reference3 == reference4);
    }
}

JDK1.6 執行輸出結果:

false
false

JDK1.7 執行輸出結果:

false
true

大傢可以先思考一下為什麼結果是這樣的?往下會具體介紹!

String##intern()源碼

先來看一下intern()方法的JDK源碼如下:

    /**
     * Returns a canonical representation for the string object.
     * <p>
     * A pool of strings, initially empty, is maintained privately by the
     * class {@code String}.
     * <p>
     * When the intern method is invoked, if the pool already contains a
     * string equal to this {@code String} object as determined by
     * the {@link #equals(Object)} method, then the string from the pool is
     * returned. Otherwise, this {@code String} object is added to the
     * pool and a reference to this {@code String} object is returned.
     * <p>
     * It follows that for any two strings {@code s} and {@code t},
     * {@code s.intern() == t.intern()} is {@code true}
     * if and only if {@code s.equals(t)} is {@code true}.
     * <p>
     * All literal strings and string-valued constant expressions are
     * interned. String literals are defined in section 3.10.5 of the
     * <cite>The Java&trade; Language Specification</cite>.
     *
     * @return  a string that has the same contents as this string, but is
     *          guaranteed to be from a pool of unique strings.
     */
    public native String intern();

很顯然通過源碼可以看到intern()是一個native本地方法,但是native具體實現源碼已經被隱藏瞭,這是一個歷史故事瞭,SUN公司在JDK7開發期間,由於技術競爭和商業競爭陷入泥潭,無力再投入精力繼續研發JDK,Oracle半路殺出直接收購Sun公司,Oracle接管JDK的研發後,發版瞭自己的Oracle JDK,Oracle的native底層等很多源碼就被隱藏瞭,不過Oracle官方也聲明OpenJDK和Oracle JDK7及以後版本,源碼幾乎是一模一樣的,想要瞭解native底層源碼具體實現過程,可以下載開源的OpenJDK的源碼進行查看。

OpenJDK官網:https://hg.openjdk.java.net/
GitHub也開源啦:https://github.com/openjdk/jdk

例如String對應的OpenJDK底層源碼主入口:jdk7\jdk\src\share\native\java\lang\String.c

Java_java_lang_String_intern(JNIEnv *env, jobject this)
{
    return JVM_InternString(env, this);
}

native底層方法的實現,需要掌握C和C++的語法,學習門檻要求比較高,這裡不是我們要學習的重點,不做具體介紹。

String#intern()方法作用

前面JDK源碼intern()方法的英文註釋已經說明瞭intern()方法的有具體用途瞭,網上也有很多說明,不過這裡我以個人的理解以及話術簡單概括下intern()方法的作用如下:

(1)隻要調用String對象的intern(),都會去找到字符串常量池,然後判斷String對象的字符串內容是否已經存在常量池中,不存在,則往字符串常量池中創建該字符串內容的對象(JDK6及之前)或創建新的引用並指向堆區已有對象地址(JDK7之後),存在則直接返回。

(2)JDK7時,字符串常量池從永久代脫離,遷移到堆區中,相比於JDK6,變化不隻是字符串常量池遷移到堆區而已,另一個變化就是調用字符串對象的intern()方法,如果字符串常量池中不存在該字符串內容的對象,則不會再像JDK6直接往字符串常量池中創建該字符串內容的對象,而是創建一個新的引用並指向堆區已有對象地址,實現字符串常量池和堆區字符串共用的目的,效率更高。

JDK6 String#intern()執行說明

一張圖介紹前面示例代碼JDK6執行過程如下:

在這裡插入圖片描述

/**
 * JDK6 String#intern()執行說明
 */
public class StringInternTest {
    public static void main(String[] args) {
        //Step6.1
        //創建瞭2個對象,分別是堆區的String對象和字符串常量池中的"a"對象,reference1引用指向在堆區中的對象地址
        String reference1 = new String("a");
        //Step6.2
        //判斷字符串常量池,是否該字符串"a",此前,池中已經有該對象瞭,因此會返回池中的對象地址的引用
        reference1.intern();
        //Step6.3
        //字符串常量池中已存在字符串"a",因此reference2引用直接指向對象在字符串常量池中的地址
        String reference2 = "a";
        //reference1指向對象地址是在堆區,reference2指向對象地址是在永久代的常量池,顯然不可能一樣
        System.out.println(reference1 == reference2);

        //Step6.4
        //創建瞭2個對象,分別是在堆區的String對象(內容是"aa")和字符串常量池中的"a"對象
        //reference3引用指向對象在堆區中的地址,這過程還會在堆區創建瞭兩個無引用的"a"對象,這裡不做討論
        String reference3 = new String("a") + new String("a");
        //Step6.5
        //判斷永久代中的字符串常量池,是否存在該字符串"aa",這裡是首次出現,因此直接將字符串拷貝並放到池中
        reference3.intern();
        //Step6.6
        //池中已存在該字符串,reference2引用直接指向對象在永久代字符串常量池中的地址
        String reference4 = "aa";
        //同樣,reference3指向堆區地址,reference4指向永久代常量池中的地址,顯然不可能一樣
        System.out.println(reference3 == reference4);
    }
}

JDK7 String#intern()執行說明

一張圖介紹前面示例代碼JDK7執行過程如下:

在這裡插入圖片描述

/**
 * JDK1.7 String#intern()執行說明
 **/
public class StringInternTest {
    public static void main(String[] args) {
        //Step7.1
        //創建瞭2個對象,分別是堆區的String對象和字符串常量池中的"a"對象,reference1引用指向在堆區中的對象地址
        String reference1 = new String("a");
        //Step7.2
        //判斷字符串常量池,是否該字符串"a",此前,池中已經有該對象瞭,因此會返回池中的對象地址的引用
        reference1.intern();
        //Step7.3
        //字符串常量池中已存在字符串"a",因此reference2引用直接指向對象在字符串常量池中的地址
        String reference2 = "a";
        //reference1指向對象地址是在堆區,reference2指向對象地址是在堆區的字符串常量池,引用指向的對象地址不一樣
        System.out.println( reference1 == reference2);

        //Step7.4
        //創建瞭2個對象,分別是在堆區的String對象(內容是"aa")和字符串常量池中的"a"對象(註意並不會創建"aa"對象)
        //reference3引用指向對象在堆區中的地址,這過程還會在堆區創建瞭兩個無引用的"a"對象,這裡不做討論
        String reference3 = new String("a") + new String("a");
        //Step7.5
        //判斷堆區的字符串常量池中,是否存在該字符串"aa",顯然這裡是首次出現
        //但並不像JDK6會新建對象"aa"存儲,而是存儲指向堆區已有對象地址的一個新引用
        reference3.intern();
        //Step7.6
        //指向池中已有該字符串的新引用,reference4引用直接指向字符串常量池中的這個新引用,新引用則指向堆區已有對象地址
        String reference4 = "aa";
        //reference4指向新引用,而新引用則指向堆區已有對象地址,跟reference3引用直接指向的對象地址是同一個
        System.out.println(reference3 == reference4);
    }

經典面試問題之創建瞭幾個對象?

在實際的Java面試當中,經常會被問到字符串創建瞭幾個對象的問題,主要是考察學習者對於對象的實例化以及字符串常量池在JVM結構體系中是如何運行的,個人覺得比較常見問題,無法就是如下幾個:

1、最簡單的比如:String s1 = “a” + “b”;創建瞭幾個對象?

答:最多1個,多個字符串常量相加會被編譯器優化為一個字符串常量即”ab”,如果字符串常量池不存在,則創建該對象。

2、相對簡單的比如:String s1 = new String(“ab”);創建瞭幾個對象?

答:1個或2個,使用new實例化對象,必然會在堆區創建一個對象,另外一個就是如果在字符串常量池中不存在”ab”這個對象,則會創建這個”ab”常量對象。

3、稍微難一點的比如:String s2 = new String(“a”) + new String(“b”);創建瞭幾個對象?

答:至少4個,最多6個
堆區的1個new StringBuilder()和2個new String()
還有1個是StringBuilder()的toString()方法底層實現是new String(value, 0, count)
另外2個即”a”、”b”可能會在常量池新建對象
有的同學可能會有疑問,那這個toString過程”ab”字符串不會在常量池中也創建嗎?
答案是,不會,最後StringBuilder的toString() 的調用,底層new String(value, 0, count) 並不會在字符串常量池中去創建”ab”對象。
兩個new String相加會被優化為StringBuilder,可以通過javac和javap查看匯編指令如下:
javac InternTest.java
javap -c InternTest

public class com.justin.java.lang.InternTest {
  public com.justin.java.lang.InternTest();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: new           #2                  // class java/lang/StringBuilder
       3: dup
       4: invokespecial #3                  // Method java/lang/StringBuilder."<init>":()V
       7: new           #4                  // class java/lang/String
      10: dup
      11: ldc           #5                  // String a
      13: invokespecial #6                  // Method java/lang/String."<init>":(Ljava/lang/String;)V
      16: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      19: new           #4                  // class java/lang/String
      22: dup
      23: ldc           #8                  // String b
      25: invokespecial #6                  // Method java/lang/String."<init>":(Ljava/lang/String;)V
      28: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      31: invokevirtual #9                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      34: astore_1
      35: return
}

最難的無非就是再調用intern()方法,比如:
String s3= new String(“a”) + new String(“b”);
s3.intern();創建瞭幾個對象?

答:最少4個,最多7個
1個new StringBuilder()和2個new String
還有1個是StringBuilder()的toString()方法底層實現是new String(value, 0, count)
另外”a”、“b”可能會在常量池新建對象
最後調用intern()方法時,會去字符串常量池,判斷”ab”是否存在,不存在,JDK6時會創建”ab” 1個對象,JDK7則隻創建”ab”的引用並指向堆區內容為”ab”的StringBuilder對象地址。

到此這篇關於Java字符串的intern方法有何奧妙之處的文章就介紹到這瞭,更多相關Java intern方法內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: