Jupyter Notebook讀入csv文件時出錯的解決方案

問題

jupyter notebook讀入csv數據時出現錯誤

“SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3: truncated \UX”

解決方法

將文件路徑中’C:\Users\huangyanli\Desktop\churn.csv’的“\”改為“\\”就可以瞭。

完美解決問題。

補充:Jupyter notebook 導出的csv 文件是亂碼的解決方案

本人使用的是Jupyter notebook 編輯器做數據分析的,API 是pyspark,有時候需要把 pyspark DataFrame 轉成 pandas Dataframe,然後轉成CSV 文件去匯報工作,發現有中文導出的時候是亂碼,問瞭運維的同事的他們已經設置成瞭UTF-8 的模式,我在代碼裡也設置瞭UTF-8 .後來發現是CSV的問題,先將CSV用txt記事本打開,然後選擇ANSI編碼方式。

另存為,點編碼這裡,這裡的編碼有這麼幾種選擇,最後用excel去打開就可以瞭。

pyspark 導出代碼:

aa1 = aa.toPandas()
aa1.to_csv('output_file.csv')

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。