jupyter讀取錯誤格式文件的解決方案

使用pandas讀取xml文件報錯

“ Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve’ ”

解決辦法：

轉換文件格式，使用excel打開xml文件選擇：文件—>另存為—->彈框

保存以後，再次用pandas讀取對應格式的文件讀取即可

補充：

在jupyter中讀取CSV文件時出現‘utf-8′ codec can’t decode byte 0xd5 in position 0: invalid continuation byte解決方法

導入 import pandas as pd

使用pd.read_csv()讀csv文件時，出現如下錯誤：

UnicodeDecodeError: ‘utf-8′ codec can’t decode byte 0xd5 in position 0: invalid continuation byte

CSV文件不是UTF-8進行編碼，而是用gbk進行編碼的。jupyter-notebook使用的Python解釋器的系統編碼默認使用UTF-8.

1.找到使用的csv文件—>鼠標右鍵—>打開方式—->選擇記事本

2.打開文件選擇“文件”—–>”另存為“，我們可以看到默認編碼是：ANSI，選擇UTF-8重新保存一份，再使用pd.read_csv()打開就不會保存瞭

使用pd.read()讀取CSV文件時，進行編碼

pd.read(filename,encoding='gbk')

比如：

以上為個人經驗，希望能給大傢一個參考，也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方，望不吝賜教。