Python實現文本文件拆分寫入到多個文本文件的方法

引言

將一個txt文本文件中的內容行拆分固定的行數,自動分批寫入到多個文本文件。
比如:一個源txt文件有5100行數據,每1000行插入到一個txt文件,最後獲得6個txt文件(5個文本文件有1000行數據,第6個文本文件有100行數據)。

步驟

1、先建立一個目錄用於存放分割後的txt文件(這裡的目錄名為:dataText)
2、修改拆分的數目(這裡是每5000行數據存入一個txt文件)
3、運行python文件,查看生成的txt文件

代碼

open_diff = open('data.txt', 'r') # 源文本文件
diff_line = open_diff.readlines()

line_list = []
for line in diff_line:
    line_list.append(line)

count = len(line_list) # 文件行數
print('源文件數據行數:',count)
# 切分diff
diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個文件的數據行數

# 將切分的寫入多個txt中
for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫入txt,計算需要寫入的文件數
    with open('./dataText/ImageData%d.txt'% j,'w+') as temp:
        for line in diff_match_split[i]:
            temp.write(line)
print('拆分後文件的個數:',i+1)

結果

在這裡插入圖片描述

在這裡插入圖片描述

應用:

將txt文件中的數據拆分成多個文本文件,可以解決由於文本文件數據過大而無法導入某些軟件的問。

這裡是將一個url文本文件(約15M)導入idm下載url中的內容,但由於文本文件過大,數據量過多,就拆分成多個文本文件分批次導入idm。

註意:
1、程序中的5000為寫入每個文件的數據行數,最後一個文件的行數不足5000,也用一個文本文件存儲。
2、根據需要,修改存儲數據的行數(兩個地方的5000都需要修改)。

到此這篇關於Python實現文本文件拆分寫入到多個文本文件的方法的文章就介紹到這瞭,更多相關Python 文本文件拆分內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀:

    None Found