python數據分析之文件讀取詳解

前言:

如果你使用的是Anaconda中的Jupyter,則不需要下載Pands和Numpy庫;如果你使用的是pycharm或其他集成環境,則需要Pands和Numpy庫

一·Numpy庫中操作文件

1.操作csv文件

import numpy as np
a=np.random.randint(0,10,size=(3,4))
np.savetext("score.csv",a,deliminter=",")

a:自己隨便創建的數組,deliminter:分隔符,score:要讀取的文件名

或者

import numpy as np
data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)

skiprows:跳過第一行,dtype:數據讀出的類型為字符型

2.在pycharm中操作csv文件

import csv
with open("score.csv",'r')as fp:
reader=csv.reader(fp)
for x in reader:
     print(x)

reader:迭代器

3.其他情況(.npy類型文件)

import numpy as np
c=np.random.randint(0,10,size=(2,3))
np.save("文件名",c)
c1=np.load("文件名.npy")

二·Pandas庫中操作文件

1.操作csv文件

import pandas as pd
df=pd.read_csv("exl.csv")

或者

import pandas as pd
pd.read_table("exl.csv",sep=',')

sep:分隔符

2.從剪貼板上復制數據

import pandas as pd
BS=pd.read_clipboard

3.讀取excel或xlsx文件

import pandas as pd
df=read_excel("exl.xlsx")

三·補充

1.常用

import osos.chdir()

chdir()中寫上你想讀取文件的目錄,表示將目錄轉化到你想讀取文件的目錄.

2.pandas中讀取文件的函數

read_csv  從文件,URL,文件型對象中加載帶分隔符的數據。默認分隔符為逗號

read_table   同上,但默認分隔符為制表符(“t”)

read_fwf  讀取定寬列格式數據(無分隔符)

read_clipboard  讀取剪貼板中的數據

read_excel  從Excel 或xlsx文件中讀取表格數據

read_hdf   讀取pandas寫的HDF5文件

read_html  讀取html文檔中的所以表格

read_json    讀取json字符串中的數據

read_msgpack 二進制格式編碼的pandas數據

read_pickle  讀取python pickle 格式中存儲的任意對象

read_sas   讀取存儲於SAS系統自定義存儲格式為SAS數據集

read_sql   讀取SQL查詢結果為pandas的DataFrame

read_stata 讀取stata文件格式的數據集

總結

到此這篇關於python數據分析之文件讀取詳解的文章就介紹到這瞭,更多相關python文件讀取內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: