Python實現文本文件拆分寫入到多個文本文件的方法
引言
將一個txt文本文件中的內容行拆分固定的行數,自動分批寫入到多個文本文件。
比如:一個源txt文件有5100行數據,每1000行插入到一個txt文件,最後獲得6個txt文件(5個文本文件有1000行數據,第6個文本文件有100行數據)。
步驟
1、先建立一個目錄用於存放分割後的txt文件(這裡的目錄名為:dataText)
2、修改拆分的數目(這裡是每5000行數據存入一個txt文件)
3、運行python文件,查看生成的txt文件
代碼
open_diff = open('data.txt', 'r') # 源文本文件 diff_line = open_diff.readlines() line_list = [] for line in diff_line: line_list.append(line) count = len(line_list) # 文件行數 print('源文件數據行數:',count) # 切分diff diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個文件的數據行數 # 將切分的寫入多個txt中 for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫入txt,計算需要寫入的文件數 with open('./dataText/ImageData%d.txt'% j,'w+') as temp: for line in diff_match_split[i]: temp.write(line) print('拆分後文件的個數:',i+1)
結果
應用:
將txt文件中的數據拆分成多個文本文件,可以解決由於文本文件數據過大而無法導入某些軟件的問。
這裡是將一個url文本文件(約15M)導入idm下載url中的內容,但由於文本文件過大,數據量過多,就拆分成多個文本文件分批次導入idm。
註意:
1、程序中的5000為寫入每個文件的數據行數,最後一個文件的行數不足5000,也用一個文本文件存儲。
2、根據需要,修改存儲數據的行數(兩個地方的5000都需要修改)。
到此這篇關於Python實現文本文件拆分寫入到多個文本文件的方法的文章就介紹到這瞭,更多相關Python 文本文件拆分內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- None Found