Java字符串拼接的優雅方式實例詳解

背景

字符串拼接不管是在業務上,還是寫算法時都會頻繁使用到。對於Java來說,字符串拼接有著很多種方式,他們之間的區別是什麼,對應不同的業務哪種更好用呢。

String底層原理

在討論字符串拼接時,首先需要知道String的底層原理。

我們這裡隻討論jdk1.8之後的情況,看下結構

private final byte[] value;

這一行代碼已經可以說明很多東西。字符串實質就是不可變的byte數組。因為不可變,所以對他進行拼接對他拼接實際就是生成瞭多個對象,這就是不鼓勵對字符串進行拼接的原因。但不可變也有很多好處,例如線程安全、可以存在字符串緩沖池復用字符串等。

拼接的方法

經典但有時不優雅的 +

String a = "123";
String b = "456";
String c = a + b;

c這個字符串就是ab拼接起來的字符串,“123456”

這段代碼反編譯出來的代碼是

String c = (new StringBuilder()).append(a).append(b).toString();
​

可以看出這個 + 是Java的語法糖,他實際上是調用的StringBuilder,通過append()來進行拼接。關於StringBuilder我們後面再講,先來講下這個用法的優缺點。

優點

“+”,最大的優點就是簡潔。如果兩個字符串需要首尾拼接,+號義不容辭的成為瞭最好的使用方式。

缺點

說到缺點的話就多瞭。簡潔也是他的最大缺點,也就是不夠靈活。

業務一

有一個字符串List,我需要把他們拼接起來,怎麼辦?

for(String tmp:list){
    s += tmp;
}

簡潔的一批,但是他隱藏著很大的問題!

上面說到這種拼接方式實際是通過StringBuilder的append的方法。你不需要知道他的原理,你隻需要知道,每次循環,他都會new一個StringBuilder對象。創建對象的開銷是很大的,如果List有幾千幾萬,內存開銷和時間開銷是不能接受的!

所以阿裡巴巴的規范說到:

表面上是推薦,實際就是禁止。寫算法會消耗大量時間導致不通過,業務也會因為這種方式提高瞭無故的開銷,屬於領導看瞭想打死的代碼。

業務二

大傢好,我叫XX,我是來自XXX學校的大X學生,我的愛好是XXX。

一個經典的模板,我需要替換掉中間的XXX為controller的參數,怎麼辦呢?

String s = "大傢好,我叫"+name+"我是來自"+school+"學校的大"+num+“學生,我的愛好是”+aihao;

屬於可用但極其醜陋的代碼。如果其他接口也需要這個模板,我還要把這段話復制到所有位置上嗎?如果我要改動這個,我要對所有代碼進行改動嗎。

萬能的StringBuilder

先介紹下StringBuilder的原理。把字符串拼接想象成數組就很好理解瞭,StringBuilder有點類似於ArrayList,可變數組。

    /**
     * The value is used for character storage.
     */
    char[] value;

區別就是沒有final修飾,當到達閾值時進行擴容操作。append方法就是往後插入。

那麼就可以解決上面業務一的問題瞭。

StringBuilder sb = new StringBuilder();
for(String tmp:list){
    sb.append(tmp);
}
String s = sb.tostring();

相比於上面,隻創建瞭一個StringBuilder對象,減少循環創建的開銷。

線程安全的StringBuffer

StringBuffer與StringBuilder相比,有線程安全的優勢,通過上鎖的方式。同時導致效率略低於StringBuilder。

靈活的String.format()

這個嚴格來說應該叫做格式化,但也可以用來拼接。

熟悉c語言的應該能夠懂,我這裡舉一個例子

String msg = String.format(“我是%s小學的學生,我愛吃%s”,"陽光","屎");
//輸出 我是陽光小學的學生,我愛吃屎

使用字符串鏈代替%s,生成需要的字符串。也不僅可以拼接字符串,可以看下下圖(偷的圖,沒全部驗證過,錯瞭別找我)

這種方式就解決瞭業務二的問題。通過編寫枚舉或者常量字符串留出對應的位置,使用時再用String.format()拼接。

有點綠色的concat

為什麼說他綠色呢,就是我還沒有找到他有什麼優勢。

String s = "123".concat("456");
//結果等價於
String s = "123" + "456";

concat方法的原理是數組擴容後復制之前的內容並寫新的內容,和StringBuilder底層有點相像。

但是相比於“+”號來說,既不簡便,又沒有什麼效率上的提高。在循環字符串拼接的條件,效率上會略有一點優勢,但是這種情況是根本不被允許的,所以concat就很雞肋。

JDK1.8優雅寫法

剛才提到業務一的解決辦法可以使用樸素的StringBuilder來解決,但是對於業務代碼來說有一點冗長。
Jdk1.8給出瞭優雅的答案

String s = String.join("_", list);

一行代碼,就可以把list裡的字符串通過“_”拼接起來。

經典的Guava

guava是我們crud程序員的好夥伴,這裡就不用多說瞭。我們最常接觸到的其實就是guava的本地緩存和字符串操作。

String result = Joiner.on(",").join(list);

也是簡潔的一句話,但是相比於jdk本土的字符串方法來說,他還有一些其他的特性。例如可以把為null的數組給跳過或者替換掉等等。功能要比jdk的要豐富一點。在正常的web項目裡基本都會有Guava的依賴,使用起來還是很方便的。

總結

這篇文章偏重於代碼編寫方面,如何寫出簡潔高效的代碼,是我們要追求的。不要讓你寫的垃圾代碼惡心到接手的同事就好瞭。

到此這篇關於Java字符串拼接的優雅方式的文章就介紹到這瞭,更多相關Java字符串拼接內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: