Python3壓縮和解壓縮實現代碼

一、說明

壓縮和解壓縮是日常常用的操作,不管是windows上圖形界面的操作,還是linux上用命令來進行壓縮解壓縮,總的而言都還是比較方便的。

但用代碼來實現就沒做過,近期也得實現代碼壓縮與解壓縮操作,所以就抽時間來研究一下。

二、zip文件壓縮和解壓縮實現

import os
import zipfile

# 函數功能是zip_file_list所有文件,和zip_dir_list所有目錄下的所有文件,被壓縮到一個zip_file_name的壓縮文件中
def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]):
  # 壓縮文件最後需要close,為瞭方便我們直接用with
  with zipfile.ZipFile(zip_file_name, "w") as zip_obj:
    # 壓縮文件
    for tmp_file in zip_file_list:
      zip_obj.write(tmp_file)
    # 壓縮目錄
    for tmp_dir in zip_dir_list:
      # zipfile沒有直接壓縮目錄的功能,要壓縮目錄隻能遍歷目錄一個一個文件壓。
      for root, dirs, files in os.walk(tmp_dir):
        # 如果想要目錄為空時仍將該目錄壓縮進去,該目錄也要壓縮一遍;反之請將以下行註釋掉
        zip_obj.write(root)
        for tmp_file in files:
          # 拼接文件完整目錄,不然隻用文件名代碼找不到文件
          tmp_file_path = os.path.join(root, tmp_file)
          zip_obj.write(tmp_file_path)


# 函數功能是遍歷壓縮文件中的所有文件
def my_traversal_zip_function(zip_file_name):
  with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
    # 返回結果是一個ZipInfo列表
    # 如果在壓縮時顯示壓縮目錄,則目錄也作為一個單獨的ZipInfo呈現在列表中;反之則沒有目錄的ZipInfo
    all_file_list = zip_obj.infolist()
    for tmp_file in all_file_list:
      print(tmp_file.filename)
      # 還可以在不解壓的情況下直接讀取文件的內容
      # 可以通過ZipInfo.is_dir()來區分是文件還是目錄
      # if not tmp_file.is_dir():
      #   with zip_obj.open(tmp_file) as zip_fd:
      #     print(zip_fd.read())

# 函數的功能是將壓縮文件直接解壓
def my_unzip_function(zip_file_name, path="."):
  with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
    zip_obj.extractall(path=path)

if __name__ == "__main__":
  zip_file_name = "test_zip.zip"
  # 自己在測試時要先自行創建好要壓縮的文件和目錄
  zip_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
  zip_dir_list = ["test_tar_dir"]
  my_zip_function(zip_file_name, zip_file_list, zip_dir_list)
  my_traversal_zip_function(zip_file_name)
  # my_unzip_function(zip_file_name, path=".")

三、tar文件的壓縮與解壓縮實現

除瞭直接的.tar文件,還包括.tar.gz/.tar.bz2/.tar.xz等格式文件的壓縮與解壓縮實現。

import os
import tarfile

# Python學習交流群:778463939
# 函數功能是tar_file_list所有文件,和tar_dir_list所有目錄下的所有文件,被壓縮到一個tar_file_name的壓縮文件中
def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"):
  # 本來也應該是tarfile.TarFile(tar_file_name, model)來創建的,但TarFile不支持"r:gz"等擴展形式
  # 壓縮文件最後需要close,為瞭方便我們直接用with
  with tarfile.open(tar_file_name, model) as tar_obj:
    # 壓縮文件
    for tmp_file in tar_file_list:
      tar_obj.add(tmp_file)
    # 壓縮目錄。和zipfile相比tarfile允許直接壓縮目錄,而不需要去遍歷目錄一個個文件壓
    for tmp_dir in tar_dir_list:
      tar_obj.add(tmp_dir)


# 函數功能是遍歷壓縮文件中的所有文件
def my_traversal_tar_function(tar_file_name, model="r"):
  with tarfile.open(tar_file_name, model) as tar_obj:
    # 返回結果是一個TarInfo列表
    all_file_list = tar_obj.getmembers()
    for tmp_file in all_file_list:
      print(tmp_file.name)
      # 還可以在不解壓的情況下直接讀取文件的內容
      # 可以通過TarInfo.isdir()來區分是文件還是目錄
      # if not tmp_file.isdir():
      #   # 相當於zip的open,並不會把文件給解壓出來
      #   tar_fd = tar_obj.extractfile(tmp_file)
      #   print(tar_fd.read())


# 函數的功能是將壓縮文件直接解壓
def my_untar_function(tar_file_name, path=".", model="r"):
  with tarfile.open(tar_file_name, model) as tar_obj:
    tar_obj.extractall(path=path)


if __name__ == "__main__":
  # 自己在測試時要先自行創建好要壓縮的文件和目錄
  tar_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
  tar_dir_list = ["test_tar_dir"]
  tar_file_name = "test_tar.tar"
  # 在.tar基礎上,tarfile還支持gz/bz2/xz的壓縮,隻要在原來打開模式的基礎上使用:或|接上壓縮方法即可,如"r:gz"
  # 特別的,如果是讀取文件,可以使用"r:*"來指示嘗試以任意格式讀取
  open_model = "w"
  # open_model = "w:gz"
  my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)
  open_model = "r"
  # open_model = "r:*"
  my_traversal_tar_function(tar_file_name, model=open_model)
  # open_model = "r:*"
  # my_untar_function(tar_file_name, path=".", model=open_model)

到此這篇關於Python3壓縮和解壓縮實現代碼的文章就介紹到這瞭,更多相關Python3壓縮和解壓縮內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: