Python 讀取 .gz 文件全過程

Python 讀取 .gz 文件

讀取.gz 文件需要使用gzip 包,如果沒有安裝可以自行在終端安裝

pip install gzip
import gzip
path = "" #你的文件路徑
f = gzip.open(path, 'rb')
 
for line in f.readlines(): # 按行進行讀取
    s = line.decode() # 讀取之後要進行解碼
    print(s) # s 為string類型,就是我們讀取的文件中的一行

也可以批量讀取,批量讀取文件使用os包對文件夾中的所有文件進行

import gzip
import os\
 
path = "" #表示你要打開的文件夾
files = os.listdir(path) #files 是path中存放的所有文件名集合
for file in files:
    f = gzip.open(path+file, 'rb')
    for line in f.readline():
        print(line)

Python 讀取gz文件,字符串與字節串的相互轉換

首先是字節串轉字符串,也就是str:

b = b'some byte array'
 
str(b, encoding = "utf-8")  
#or
bytes.decode(b)

然後是字符串轉為字節串:

s = 'some string'
 
bytes(s, encoding = "utf8")  
#or
str.encode(s)

fastq.gz文件讀取

with gzip.open(fq,'r') as fastq:
    try:
        while True:
            line1 = next(fastq).decode()  # 字節轉字符串
            line2 = next(fastq).decode()
            line3 = next(fastq).decode()
            line4 = next(fastq).decode()
            
    except:
            pass

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: