python數據分析之文件讀取詳解
前言:
如果你使用的是Anaconda中的Jupyter,則不需要下載Pands和Numpy庫;如果你使用的是pycharm或其他集成環境,則需要Pands和Numpy庫
一·Numpy庫中操作文件
1.操作csv文件
import numpy as np a=np.random.randint(0,10,size=(3,4)) np.savetext("score.csv",a,deliminter=",")
a:自己隨便創建的數組,deliminter:分隔符,score:要讀取的文件名
或者
import numpy as np data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)
skiprows:跳過第一行,dtype:數據讀出的類型為字符型
2.在pycharm中操作csv文件
import csv with open("score.csv",'r')as fp: reader=csv.reader(fp) for x in reader: print(x)
reader:迭代器
3.其他情況(.npy類型文件)
import numpy as np c=np.random.randint(0,10,size=(2,3)) np.save("文件名",c) c1=np.load("文件名.npy")
二·Pandas庫中操作文件
1.操作csv文件
import pandas as pd df=pd.read_csv("exl.csv")
或者
import pandas as pd pd.read_table("exl.csv",sep=',')
sep:分隔符
2.從剪貼板上復制數據
import pandas as pd BS=pd.read_clipboard
3.讀取excel或xlsx文件
import pandas as pd df=read_excel("exl.xlsx")
三·補充
1.常用
import osos.chdir()
chdir()中寫上你想讀取文件的目錄,表示將目錄轉化到你想讀取文件的目錄.
2.pandas中讀取文件的函數
read_csv 從文件,URL,文件型對象中加載帶分隔符的數據。默認分隔符為逗號
read_table 同上,但默認分隔符為制表符(“t”)
read_fwf 讀取定寬列格式數據(無分隔符)
read_clipboard 讀取剪貼板中的數據
read_excel 從Excel 或xlsx文件中讀取表格數據
read_hdf 讀取pandas寫的HDF5文件
read_html 讀取html文檔中的所以表格
read_json 讀取json字符串中的數據
read_msgpack 二進制格式編碼的pandas數據
read_pickle 讀取python pickle 格式中存儲的任意對象
read_sas 讀取存儲於SAS系統自定義存儲格式為SAS數據集
read_sql 讀取SQL查詢結果為pandas的DataFrame
read_stata 讀取stata文件格式的數據集
總結
到此這篇關於python數據分析之文件讀取詳解的文章就介紹到這瞭,更多相關python文件讀取內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python利用pandas分析學生期末成績實例代碼
- pandas讀取excel,txt,csv,pkl文件等命令的操作
- 如何利用python在剪貼板上讀取/寫入數據
- Python Pandas常用函數方法總結
- R語言如何將大型Excel文件轉為dta格式詳解