Java 字符串壓縮與解壓的開發記錄

1、場景:

由於數據庫字段長度有限,並且不能隨意的修改數據庫字段的配置,數據庫的某個字段設置的長度可能在設置初期是滿足需求的,後期由於業務變更或業務量增大導致該字段存儲的數據增長,落庫時可能因為該字段數據長度過長導致落庫失敗,基於這種場景我們就有必要進行字符串的壓縮,然後再進行落庫,而落庫後取出數據使用時再進行解壓即可。

2、CompressUtil類:

使用Java8中的gzip來進行實現

import lombok.extern.slf4j.Slf4j;
import org.apache.commons.codec.binary.Base64;
import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.util.zip.GZIPInputStream;
import java.util.zip.GZIPOutputStream;
/**
 * 壓縮String的工具類
 */
@Slf4j
public class CompressUtil {
    /**
     * 使用gzip壓縮字符串
     * @param str 要壓縮的字符串
     * @return 壓縮後的字符串
     */
    public static String compress(String str) {
        if (str == null || str.length() <= 0) {
            return str;
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        try (GZIPOutputStream gzip = new GZIPOutputStream(out)) {
            gzip.write(str.getBytes(StandardCharsets.UTF_8));
        } catch (IOException e) {
            log.error("字符串壓縮失敗str:{},錯誤信息:{}", str, e.getMessage());
            throw new RuntimeException("字符串壓縮失敗");
        }
        return Base64.encodeBase64String(out.toByteArray());
    }
    /**
     * 使用gzip解壓縮
     * @param compressedStr 壓縮字符串
     * @return 解壓後的字符串
     */
    public static String uncompress(String compressedStr) {
        if (compressedStr == null || compressedStr.length() <= 0) {
            return compressedStr;
        }
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        ByteArrayInputStream in;
        GZIPInputStream gzip = null;
        byte[] compressed;
        String decompressed;
        try {
            compressed = Base64.decodeBase64(compressedStr);
            in = new ByteArrayInputStream(compressed);
            gzip = new GZIPInputStream(in);
            byte[] buffer = new byte[1024];
            int offset;
            while ((offset = gzip.read(buffer)) != -1) {
                out.write(buffer, 0, offset);
            }
            decompressed = out.toString(StandardCharsets.UTF_8.name());
        } catch (IOException e) {
            log.error("字符串解壓失敗compressedStr:{},錯誤信息:{}", compressedStr, e.getMessage());
            throw new RuntimeException("字符串解壓失敗");
        } finally {
            if (gzip != null) {
                try {
                    gzip.close();
                } catch (IOException ignored) {
                }
            }
            try {
                out.close();
            } catch (IOException ignored) {
            }
        }
        return decompressed;
    }
}

3、註意點:

1)CompressUtil在壓縮過程和解壓過程使用統一字符集,防止壓縮和解壓過程因為字符集不同導致結果與實際預期不符;

2)在web項目中,服務器端將加密後的字符串返回給前端,前端再通過ajax請求將加密字符串發送給服務器端處理的時候,在http傳輸過程中會改變加密字符串的內容,導致服務器解壓壓縮字符串發生異常;

而CompressUtil壓縮和解壓過程中使用Base64.encodeBase64String和Base64.decodeBase64進行編碼和解碼,可以完全解決上述問題。

3)壓縮/解壓失敗怎麼處理?
通過CompressUtil工具類可以看出,如果壓縮或解壓失敗,過程發生異常,則會拋出一個運行時異常給調用方,方便調用方及時感知並處理;

具體如何處理要看具體的業務場景,我這邊是在MQ消費者中調用,在MQ中統一捕獲異常,所以如果壓縮失敗會進行重試,如果重試多次依然失敗,我這邊會進行報警打印日志,內部人會去處理。

4、單元測試:

import org.junit.Test;
public class CompressUtilTest {
    @Test
    public void test1() {
        StringBuilder stringBuilder = new StringBuilder();
        for(int i = 0;i < 100000;i++) {
            stringBuilder.append("1");
        }
        System.out.println(stringBuilder.toString().length());
        String compress = CompressUtil.compress(stringBuilder.toString());
        System.out.println("compress="+compress);
        System.out.println(compress.length());
        String uncompress = CompressUtil.uncompress(compress);
        System.out.println(uncompress.length());
        System.out.println("uncompress=" + uncompress);
    }
}

測試1:100000壓縮以後為180,解壓後也可以正常返回原字符串

測試2:把壓縮字符串長度改為1000再試一次,壓縮後長度為40

壓縮比例還是很高的,親測可用!!!

到此這篇關於Java 字符串壓縮與解壓的開發記錄的文章就介紹到這瞭,更多相關Java 字符串壓縮 解壓內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: