Java 字符串壓縮與解壓的開發記錄
1、場景:
由於數據庫字段長度有限,並且不能隨意的修改數據庫字段的配置,數據庫的某個字段設置的長度可能在設置初期是滿足需求的,後期由於業務變更或業務量增大導致該字段存儲的數據增長,落庫時可能因為該字段數據長度過長導致落庫失敗,基於這種場景我們就有必要進行字符串的壓縮,然後再進行落庫,而落庫後取出數據使用時再進行解壓即可。
2、CompressUtil類:
使用Java8中的gzip來進行實現
import lombok.extern.slf4j.Slf4j; import org.apache.commons.codec.binary.Base64; import java.io.ByteArrayInputStream; import java.io.ByteArrayOutputStream; import java.io.IOException; import java.nio.charset.StandardCharsets; import java.util.zip.GZIPInputStream; import java.util.zip.GZIPOutputStream; /** * 壓縮String的工具類 */ @Slf4j public class CompressUtil { /** * 使用gzip壓縮字符串 * @param str 要壓縮的字符串 * @return 壓縮後的字符串 */ public static String compress(String str) { if (str == null || str.length() <= 0) { return str; } ByteArrayOutputStream out = new ByteArrayOutputStream(); try (GZIPOutputStream gzip = new GZIPOutputStream(out)) { gzip.write(str.getBytes(StandardCharsets.UTF_8)); } catch (IOException e) { log.error("字符串壓縮失敗str:{},錯誤信息:{}", str, e.getMessage()); throw new RuntimeException("字符串壓縮失敗"); } return Base64.encodeBase64String(out.toByteArray()); } /** * 使用gzip解壓縮 * @param compressedStr 壓縮字符串 * @return 解壓後的字符串 */ public static String uncompress(String compressedStr) { if (compressedStr == null || compressedStr.length() <= 0) { return compressedStr; } ByteArrayOutputStream out = new ByteArrayOutputStream(); ByteArrayInputStream in; GZIPInputStream gzip = null; byte[] compressed; String decompressed; try { compressed = Base64.decodeBase64(compressedStr); in = new ByteArrayInputStream(compressed); gzip = new GZIPInputStream(in); byte[] buffer = new byte[1024]; int offset; while ((offset = gzip.read(buffer)) != -1) { out.write(buffer, 0, offset); } decompressed = out.toString(StandardCharsets.UTF_8.name()); } catch (IOException e) { log.error("字符串解壓失敗compressedStr:{},錯誤信息:{}", compressedStr, e.getMessage()); throw new RuntimeException("字符串解壓失敗"); } finally { if (gzip != null) { try { gzip.close(); } catch (IOException ignored) { } } try { out.close(); } catch (IOException ignored) { } } return decompressed; } }
3、註意點:
1)CompressUtil在壓縮過程和解壓過程使用統一字符集,防止壓縮和解壓過程因為字符集不同導致結果與實際預期不符;
2)在web項目中,服務器端將加密後的字符串返回給前端,前端再通過ajax請求將加密字符串發送給服務器端處理的時候,在http傳輸過程中會改變加密字符串的內容,導致服務器解壓壓縮字符串發生異常;
而CompressUtil壓縮和解壓過程中使用Base64.encodeBase64String和Base64.decodeBase64進行編碼和解碼,可以完全解決上述問題。
3)壓縮/解壓失敗怎麼處理?
通過CompressUtil工具類可以看出,如果壓縮或解壓失敗,過程發生異常,則會拋出一個運行時異常給調用方,方便調用方及時感知並處理;
具體如何處理要看具體的業務場景,我這邊是在MQ消費者中調用,在MQ中統一捕獲異常,所以如果壓縮失敗會進行重試,如果重試多次依然失敗,我這邊會進行報警打印日志,內部人會去處理。
4、單元測試:
import org.junit.Test; public class CompressUtilTest { @Test public void test1() { StringBuilder stringBuilder = new StringBuilder(); for(int i = 0;i < 100000;i++) { stringBuilder.append("1"); } System.out.println(stringBuilder.toString().length()); String compress = CompressUtil.compress(stringBuilder.toString()); System.out.println("compress="+compress); System.out.println(compress.length()); String uncompress = CompressUtil.uncompress(compress); System.out.println(uncompress.length()); System.out.println("uncompress=" + uncompress); } }
測試1:100000壓縮以後為180,解壓後也可以正常返回原字符串
測試2:把壓縮字符串長度改為1000再試一次,壓縮後長度為40
壓縮比例還是很高的,親測可用!!!
到此這篇關於Java 字符串壓縮與解壓的開發記錄的文章就介紹到這瞭,更多相關Java 字符串壓縮 解壓內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Java字符串的壓縮與解壓縮的兩種方法
- Java日常練習題,每天進步一點點(31)
- 使用ByteArrayOutputStream寫入字符串方式
- 使用Java 壓縮文件打包tar.gz 包的詳細教程
- Java中InputSteam怎麼轉String