numpy中的converters和usecols用法詳解
用Python打開Excel數據,讀取時需要將”學號“和“ID"轉換成字符,以便後續操作
df = pd.read_excel(path, converters={'學號': str, 'ID': str})
以下是我的經歷來體會:
我在從Excel讀入python的數據時,發現讀出的是空值:
import pandas as pd df=pd.read_excel("D:/Python/05DataMineML/2022STU(1).xlsx") df
但是分明是有數據的,大概率出現的原因是sheetname
(表的名稱)出現瞭問題。
那就試試其他的方法:
下圖是Excel的表頭,共有115行數據。
方法一:使用usecols
#獲取字段的第一種寫法 import pandas as pd df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',usecols=['學號','姓名','20220101','20220125','20220202','20220208','20220213','20220220','20220226','20220311','20220320','20220327','20220403','randscore'],index_col='姓名',sheet_name='2022STUMOOC') df.info()
index_col:指定作為表格的索引值
usecols:pandas讀取excel使用read_excel()中的usecols參數讀取指定的列
sheet_name:表名
重點:要使用usecols參數,sheet_name必須顯式寫出來。
方法二:使用numpy
#獲取字段的第二種寫法:使用numpy import pandas as pd import numpy as np df=pd.read_excel('../05DataMineML/2022STU(1).xlsx',converters={'學號':str},usecols=np.arange(3,16),index_col='姓名',sheet_name='2022STU') df.head()
這裡就涉及converters:
converters={'學號':str}
:將學號轉換為字符類型,以便後續操作。
這裡使用瞭usecols=np.arange(3,16)
方法三:使用切片區間
#獲取字段的第三種寫法:切片區間 import pandas as pd import numpy as np df=pd.read_excel('../05DataMineML/2022STUMOOC (1).xlsx',converters={'學號':str},usecols=("D:P"),index_col='姓名',sheet_name='2022STUMOOC') df
這裡使用瞭usecols=("D:P")
,也就是使用瞭如下圖每列的序號值做切片
總結:
converters用法:轉換類型。比如將Excel數據一列從int變成str
usecols用法
usecols=[‘學號',‘姓名'] usecols=np.arange(3,16) usecols=(“D:P”)
到此這篇關於numpy中的converters和usecols用法詳解的文章就介紹到這瞭,更多相關numpy converters和usecols內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python使用pandas讀寫excel文件的方法實例
- python pandas處理excel表格數據的常用方法總結
- pandas 讀取excel文件的操作代碼
- R語言讀取xls與xlsx格式文件過程
- python pandas合並Sheet,處理列亂序和出現Unnamed列的解決