Python從csv文件中讀取數據及提取數據的方法

數據保存在csv文件中

在這裡插入圖片描述

1.從csv文件中讀取數據

參數header=None的有無

(1)沒有header=None——直接將csv表中的第一行當作表頭

# 讀取數據
import pandas as pd
data = pd.read_csv("data1.csv")
print(data)

打印結果為:

在這裡插入圖片描述

(2)有header=None——自動添加第一行當作表頭

# 讀取數據
import pandas as pd
data = pd.read_csv("data1.csv",header=None)
print(data)

打印結果為:

在這裡插入圖片描述

2.數據切割

(這裡根據csv表的格式,將header=None不寫)

(1)獲取所有列,並存入一個數組中

# 讀取數據
import pandas as pd
data = pd.read_csv("data1.csv")
# print(data)
# ①獲取所有列,並存入一個數組中
import numpy as np
data = np.array(data)
print(data) # 用戶編號  性別  年齡(歲)  年收入(元)  是否購買
# [[15624510        1       19    19000        0]
#  [15810944        1       35    20000        0]
#  [15668575        2       26    43000        0]
#  [15603246        2       27    57000        0]
#  [  ...          ...      ...    ...       ...]]

(2)獲取指定列的數據,並存入一個數組中
方法一:從csv文件獲取data,data[ ] ——需要考慮數據的維度問題

# 讀取數據
import pandas as pd
data = pd.read_csv("data1.csv")
print(data) # 用戶編號  性別  年齡(歲)  年收入(元)  是否購買
# (1)獲取第1列,並存入一個數組中
import numpy as np
col_1 = data["用戶編號"]  #獲取一列,用一維數據
data_1 = np.array(col_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
#  15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
#  15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
#  15705113 15631159 15792818 15633531 15744529]

# (2)獲取第1,2列
col_12 = data[["用戶編號","性別"]]  #獲取兩列,要用二維數據
data_12 = np.array(col_12)
print(data_12)
# [[15624510        1]
#  [15810944        1]
#  [15668575        2]
#  [15603246        2]
#  [  ...          ..]]

方法二:usecols=[ ] —— 直接寫入獲取的列數

import pandas as pd
import numpy as np
data_1 = pd.read_csv("data1.csv",usecols=["用戶編號"])
data_1 = np.array(data_1)
print(data_1)
# [[15624510]
#  [15810944]
#  [15668575]
#  [15603246]
#  [  ...   ]]

# (2)如獲取第1,2列
data_12 = pd.read_csv("data1.csv",usecols=["用戶編號","性別"])
data_12 = np.array(data_12)
print(data_12)
# [[15624510        1]
#  [15810944        1]
#  [15668575        2]
#  [15603246        2]
#  [  ...          ..]]

方法三:iloc[ ] ——實質就是切片操作

import pandas as pd
import numpy as np
data = pd.read_csv("data1.csv")
# (1)獲取第1列
data_1 = data.iloc[:,0]
data_1 =np.array(data_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
#  15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
#  15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
#  15705113 15631159 15792818 15633531 15744529]

# (2)獲取第1,2列
data_12 = data.iloc[:,0:2]
data_12 = np.array(data_12)
print(data_12)
# [[15624510        1]
#  [15810944        1]
#  [15668575        2]
#  [15603246        2]
#  [  ...          ..]]

# 獲取最後兩列
data_last = data.iloc[:,-2:]
data_last = np.array(data_last)
print(data_last)
# [[ 19000        0]
#  [ 20000        0]
#  [ 26    43000        0]
#  [ 27    57000        0]
#  [ ...    ...       ...]]

到此這篇關於Python從csv文件中讀取數據並提取數據的方法的文章就介紹到這瞭,更多相關Python csv文件中讀取數據內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: