Python 讀取 .gz 文件全過程
Python 讀取 .gz 文件
讀取.gz 文件需要使用gzip 包,如果沒有安裝可以自行在終端安裝
pip install gzip
import gzip path = "" #你的文件路徑 f = gzip.open(path, 'rb') for line in f.readlines(): # 按行進行讀取 s = line.decode() # 讀取之後要進行解碼 print(s) # s 為string類型,就是我們讀取的文件中的一行
也可以批量讀取,批量讀取文件使用os包對文件夾中的所有文件進行
import gzip import os\ path = "" #表示你要打開的文件夾 files = os.listdir(path) #files 是path中存放的所有文件名集合 for file in files: f = gzip.open(path+file, 'rb') for line in f.readline(): print(line)
Python 讀取gz文件,字符串與字節串的相互轉換
首先是字節串轉字符串,也就是str:
b = b'some byte array' str(b, encoding = "utf-8") #or bytes.decode(b)
然後是字符串轉為字節串:
s = 'some string' bytes(s, encoding = "utf8") #or str.encode(s)
fastq.gz文件讀取
with gzip.open(fq,'r') as fastq: try: while True: line1 = next(fastq).decode() # 字節轉字符串 line2 = next(fastq).decode() line3 = next(fastq).decode() line4 = next(fastq).decode() except: pass
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。
推薦閱讀:
- Python字符串編碼轉換 encode()和decode()方法詳細說明
- Python中bytes字節串和string字符串之間的轉換方法
- Python實現讀取文件的方法總結
- Python標準庫之zipfile和tarfile模塊的使用
- Python3讀取文件的操作詳解