python實現簡單文件讀寫函數
python作為腳本性語言,加上它的簡便易用性。會經常當作腳本用來處理一下數據和格式。其中處理文件就是頻繁用處之一。簡單編寫幾個常用的xls和txt讀寫函數,以後可以快速復用。
用到xlrd庫函數需要預先install
命令:pip install xlrd
直接貼源碼:
#! /usr/bin/python # coding:utf-8 import json import xlrd import sys reload(sys) sys.setdefaultencoding('utf-8') class ObjectFileReadAndWrite(object): @classmethod def readXlsToDict(cls, xlsFile): ''' 讀取xls文件生成dict ''' data = xlrd.open_workbook(xlsFile) table = data.sheet_by_index(0) ret = [] keys = table.row_values(0) for rowNum in range(table.nrows): oneRowValues = table.row_values(rowNum) if rowNum > 0: d = {} for colIdx, key in enumerate(keys): d[key] = oneRowValues[colIdx] ret.append(d) return ret @classmethod def readXlsToList(cls, xlsFile): ''' 讀取xls文件生成list ''' data = xlrd.open_workbook(xlsFile) table = data.sheet_by_index(0) ret = [] for rowNum in range(table.nrows): oneRowValues = table.row_values(rowNum) ret.append(oneRowValues) return ret @classmethod def readTxt(cls, txtFile, sep): ''' 讀取txt文件 ''' # with + open 可保證with語句執行完畢後同時關閉打開的文件句柄。 ret = [] with open(txtFile, "r") as f: for line in f.readlines(): line = line.strip('\n') # 去掉換行符 listInfo = line.split(sep) # 以 sep 分割成數組 if listInfo: ret.append(listInfo) return ret @classmethod def writeToJson(cls, jsonFile, ret): ''' 寫入json文件 ''' with open(jsonFile, 'w') as fp: json.dump(ret, fp, indent=2, sort_keys=True, encoding="utf-8", ensure_ascii=False) @classmethod def writeFromStr(cls, filePath, s): ''' string寫入文件 ''' with open(filePath, 'w') as fp: fp.write(s) @classmethod def writeFromList(cls, filePath, wList): ''' list寫入文件 ''' with open(filePath, 'w') as fp: fp.writelines(wList) if __name__ == "__main__": obj = ObjectFileReadAndWrite() # xls ret = obj.readXlsToDict(xlsFile='xxx.xls') obj.writeToJson('xxx.json', ret) # txt ret2 = obj.readTxt(txtFile='result.txt', sep=" ") obj.writeToJson('result.json', ret2)
因文件中有中文,中間遇到中文亂碼問題
import sys reload(sys) sys.setdefaultencoding('utf-8') # encoding="utf-8", ensure_ascii=False
1、這個是由於Unicode編碼與ASCII編碼的不兼容造成的。
2、通常都是ascii,由此Python自然調用ascii編碼解碼程序去處理字符流,當字符流不屬於ascii范圍內,就會拋出異常(ordinal not in range(128))
百度瞭下通過 以上方式 解決瞭。
以上就是本文的全部內容,希望對大傢的學習有所幫助,也希望大傢多多支持WalkonNet。
推薦閱讀:
- Python實現讀取HTML表格 pd.read_html()
- python如何讀取和存儲dict()與.json格式文件
- Python讀取xlsx文件報錯:xlrd.biffh.XLRDError: Excel xlsx file;not supported問題解決
- 如何用python合並多個excel文件
- Python如何讀寫JSON格式數據