使用Java 壓縮文件打包tar.gz 包的詳細教程

Posted on 2021-05-13 by WalkonNet

一、背景

最近，小哈主要在負責日志中臺的開發工作, 等等，啥是日志中臺？

俺隻知道中臺概念，這段時間的確很火，但是日志中臺又是用來幹啥的？

這裡小哈盡量地通俗的說下日志中臺的職責，再說日志中臺之前，我們先扯點別的？

相信大傢對集中式日志平臺 ELK 都知道一些，生產環境中, 稍復雜的架構，服務一般都是集群部署，這樣，日志就會分散在每臺服務器上，一旦發生問題，想要查看日志就會非常繁瑣，你需要登錄每臺服務器找日志，因為你不確定請求被打到哪個節點上。另外，任由開發人員登錄服務器查看日志本身就存在安全隱患，不小心執行瞭 rm -rf * 咋辦？

通過 ELK , 我們可以方便的將日志收集到一處（Elasticsearch 集群）來進行多維度的分析。

但是部署高性能、高可用的 ELK 是有門檻的，業務組想要快速的擁有集中式日志分析的能力，往往需要經過前期的技術調研，測試，踩坑，才能將這個平臺搭建起來。

日志中臺的使命就是讓業務線能夠快速擁有這種能力，隻需傻瓜式的在日志平臺完成接入操作即可。

臭嗨！說瞭這麼多，跟你這篇文章的主題有啥關系？

額，小哈這就進入主題。

既然想統一管理日志，總得將這些分散的日志采集起來吧，那麼，就需要一個日志采集器，Logstash 和 Filebeat 都有采集日志的能力，但是 Filebeat 相較於 Logstash 的笨重, 它更輕量級，幾乎零占用服務器系統資源，這裡我們選型 Filebeat。

業務組在日志平臺完成相關接入流程後，平臺會提供一個采集器包。接入方需要做的就是，下載這個采集器包並扔到指定服務器上，解壓運行，即可開始采集日志，然後，就可以在日志平臺的管控頁面分析&搜索這些被收集的日志瞭。

這個 Filebeat 采集器包裡面，包含瞭采集日志文件路徑，輸出到 Kafka 集群，以及一些個性化的采集規則等等。

怎麼樣？是不是感覺很棒呢？

二、如何通過 Java 打包文件？

2.1 添加 Maven 依賴

<dependency>
  <groupId>org.apache.commons</groupId>
  <artifactId>commons-compress</artifactId>
  <version>1.12</version>
</dependency>

2.2 打包核心代碼

通過 Apache compress 工具打包思路大致如下：

①：創建一個 FileOutputStream 到輸出文件（.tar.gz）文件。

②：創建一個GZIPOutputStream，用來包裝FileOutputStream對象。

③：創建一個TarArchiveOutputStream，用來包裝GZIPOutputStream對象。

④：接著，讀取文件夾中的所有文件。

⑤：如果是目錄，則將其添加到 TarArchiveEntry。

⑥：如果是文件，依然將其添加到 TarArchiveEntry 中，然後還需將文件內容寫入 TarArchiveOutputStream 中。

接下來，直接上代碼：

import org.apache.commons.compress.archivers.tar.TarArchiveEntry;
import org.apache.commons.compress.archivers.tar.TarArchiveOutputStream;
import org.apache.commons.io.IOUtils;

import java.io.*;
import java.util.zip.GZIPOutputStream;

/**
 * @author 犬小哈 (公眾號： 小哈學Java)
 * @date 2019-07-15
 * @time 16:15
 * @discription
 **/
public class TarUtils {

    /**
     * 壓縮
     * @param sourceFolder 指定打包的源目錄
     * @param tarGzPath 指定目標 tar 包的位置
     * @return
     * @throws IOException
     */
    public static void compress(String sourceFolder, String tarGzPath) throws IOException {
        createTarFile(sourceFolder, tarGzPath);
    }

    private static void createTarFile(String sourceFolder, String tarGzPath) {
        TarArchiveOutputStream tarOs = null;
        try {
            // 創建一個 FileOutputStream 到輸出文件（.tar.gz）
            FileOutputStream fos = new FileOutputStream(tarGzPath);
            // 創建一個 GZIPOutputStream，用來包裝 FileOutputStream 對象
            GZIPOutputStream gos = new GZIPOutputStream(new BufferedOutputStream(fos));
            // 創建一個 TarArchiveOutputStream，用來包裝 GZIPOutputStream 對象
            tarOs = new TarArchiveOutputStream(gos);
            // 若不設置此模式，當文件名超過 100 個字節時會拋出異常，異常大致如下：
            // is too long ( > 100 bytes)
            // 具體可參考官方文檔： http://commons.apache.org/proper/commons-compress/tar.html#Long_File_Names
            tarOs.setLongFileMode(TarArchiveOutputStream.LONGFILE_POSIX);
            addFilesToTarGZ(sourceFolder, "", tarOs);
        } catch (IOException e) {
            e.printStackTrace();
        }finally{
            try {
                tarOs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    public static void addFilesToTarGZ(String filePath, String parent, TarArchiveOutputStream tarArchive) throws IOException {
        File file = new File(filePath);
        // Create entry name relative to parent file path
        String entryName = parent + file.getName();
        // 添加 tar ArchiveEntry
        tarArchive.putArchiveEntry(new TarArchiveEntry(file, entryName));
        if (file.isFile()) {
            FileInputStream fis = new FileInputStream(file);
            BufferedInputStream bis = new BufferedInputStream(fis);
            // 寫入文件
            IOUtils.copy(bis, tarArchive);
            tarArchive.closeArchiveEntry();
            bis.close();
        } else if (file.isDirectory()) {
            // 因為是個文件夾，無需寫入內容，關閉即可
            tarArchive.closeArchiveEntry();
            // 讀取文件夾下所有文件
            for (File f : file.listFiles()) {
                // 遞歸
                addFilesToTarGZ(f.getAbsolutePath(), entryName + File.separator, tarArchive);
            }
        }
    }

    public static void main(String[] args) throws IOException {
        // 測試一波，將 filebeat-7.1.0-linux-x86_64 打包成名為 filebeat-7.1.0-linux-x86_64.tar.gz 的 tar 包
        compress("/Users/a123123/Work/filebeat-7.1.0-linux-x86_64", "/Users/a123123/Work/tmp_files/filebeat-7.1.0-linux-x86_64.tar.gz");
    }

}

至於，代碼每行的作用，小夥伴們可以看代碼註釋，說的已經比較清楚瞭。

接下來，執行 main 方法，測試一下效果，看看打包是否成功：

生成采集器 tar.gz 包成功後，業務組隻需將 tar.gz 下載下來，並扔到指定服務器，解壓運行即可完成采集任務啦~

三、結語

本文主要還是介紹如何通過 Java 來完成打包功能，關於 ELK 相關的知識，小哈會在後續的文章中分享給大傢，本文隻是提及一下，歡迎小夥伴們持續關註喲，下期見~

到此這篇關於使用Java 壓縮文件打包tar.gz 包的詳細教程的文章就介紹到這瞭,更多相關Java 壓縮文件打包tar.gz 包內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

使用Java 壓縮文件打包tar.gz 包的詳細教程

一、背景

二、如何通過 Java 打包文件？

2.1 添加 Maven 依賴

2.2 打包核心代碼

三、結語

推薦閱讀：

發佈留言取消回覆

近期文章

一、背景

二、如何通過 Java 打包文件？

2.1 添加 Maven 依賴

2.2 打包核心代碼

三、結語

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆