jupyter讀取錯誤格式文件的解決方案

使用pandas讀取xml文件報錯

“ Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve’ ”

解決辦法:

轉換文件格式,使用excel打開xml文件 選擇:文件—>另存為—->彈框

保存以後,再次用pandas讀取對應格式的文件讀取即可

補充:

在jupyter中讀取CSV文件時出現‘utf-8′ codec can’t decode byte 0xd5 in position 0: invalid continuation byte解決方法

導入 import pandas as pd

使用pd.read_csv()讀csv文件時,出現如下錯誤:

UnicodeDecodeError: ‘utf-8′ codec can’t decode byte 0xd5 in position 0: invalid continuation byte

出現原因:

CSV文件不是UTF-8進行編碼,而是用gbk進行編碼的。jupyter-notebook使用的Python解釋器的系統編碼默認使用UTF-8.

解決方式有兩種

第一種:

1.找到使用的csv文件—>鼠標右鍵—>打開方式—->選擇記事本

2.打開文件選擇“文件”—–>”另存為“,我們可以看到默認編碼是:ANSI,選擇UTF-8重新保存一份,再使用pd.read_csv()打開就不會保存瞭

第二種:

使用pd.read()讀取CSV文件時,進行編碼

pd.read(filename,encoding='gbk')

比如:

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。