jupyter讀取錯誤格式文件的解決方案
使用pandas讀取xml文件報錯
“ Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve’ ”
解決辦法:
轉換文件格式,使用excel打開xml文件 選擇:文件—>另存為—->彈框
保存以後,再次用pandas讀取對應格式的文件讀取即可
補充:
在jupyter中讀取CSV文件時出現‘utf-8′ codec can’t decode byte 0xd5 in position 0: invalid continuation byte解決方法
導入 import pandas as pd
使用pd.read_csv()讀csv文件時,出現如下錯誤:
UnicodeDecodeError: ‘utf-8′ codec can’t decode byte 0xd5 in position 0: invalid continuation byte
出現原因:
CSV文件不是UTF-8進行編碼,而是用gbk進行編碼的。jupyter-notebook使用的Python解釋器的系統編碼默認使用UTF-8.
解決方式有兩種
第一種:
1.找到使用的csv文件—>鼠標右鍵—>打開方式—->選擇記事本
2.打開文件選擇“文件”—–>”另存為“,我們可以看到默認編碼是:ANSI,選擇UTF-8重新保存一份,再使用pd.read_csv()打開就不會保存瞭
第二種:
使用pd.read()讀取CSV文件時,進行編碼
pd.read(filename,encoding='gbk')
比如:
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- Jupyter Notebook讀入csv文件時出錯的解決方案
- Python字符串編碼轉換 encode()和decode()方法詳細說明
- Python有關Unicode UTF-8 GBK編碼問題詳解
- Python UnicodedecodeError編碼問題解決方法匯總
- Jupyter Notebook讀取csv文件出現的問題及解決