Python學習之.iloc與.loc的區別、聯系和用法
最近接觸到數據科學,需要對一些數據表進行分析,觀察到代碼中一會出現loc一會又出現iloc,下面對兩者的用法給出我的一些理解。
1.聯系
(1)操作對象相同:loc和iloc都是對DataFrame類型進行操作;
(2)完成目的相同:二者都是用於選取DataFrame中對應行或列中的元素。
2.區別
loc和iloc索引的行列標簽類型不同。
iloc使用順序數字來索引數據,而不能使用字符型的標簽來索引數據;註意:這裡的順序數字是指從0開始計數!
loc使用實際設置的索引來索引數據。但行列名為數字時,loc也可以索引數字,但這裡的數字不一定從0開始編號,是對應具體行列名的數字!
3.用法
下面用代碼來講解兩者的用法。
3.1行列全為從0開始順序編號
import pandas as pd import numpy as np a = np.arange(12).reshape(3,4) #將a轉化為DataFrame類型 df = pd.DataFrame(a) #展示df df
由於未給df的行列命名,默認從0開始編號,所以這個時候使用loc和iloc結果是一樣的。
索引為一個數,默認輸出行 print(df.loc[0])#輸出第0行元素 print(df.iloc[0])#輸出第0行元素
兩者輸出結果都為:
0 0
1 1
2 2
3 3
Name: 0, dtype: int32
輸出結果為df第0行元素,結果中第一列表示列名,第二列表示具體的值。如果隻需要輸出某一列,輸入df.loc[:,0]表示輸出第0列。
如果需要輸出第0到2列的數據。
#方式1 df.loc[:,0:2]#可把loc理解為遍歷字符串類型,0:2則表示標簽為0,1,2三列 #方式2 df.iloc[:,0:3]#iloc遍歷的數數字,python中0:3對應0,1,和2
輸出結果均為:
3.2有一行或列不是從0順序編號
#把行標簽換成其他數字編號 df.index=[2,5,7] df.loc[2]
此時df變為:
輸出結果為:
0 0
1 1
2 2
3 3
Name: 2, dtype: int32
輸出結果對應的是列標簽為“2”所在的行。
我們繼續用df.iloc[2]輸出結果:
0 8
1 9
2 10
3 11
Name: 7, dtype: int32
可見輸出的是第2行的數據。
在這裡我們能大概對loc和iloc的用法有瞭一定的瞭解。
3.3行或者列為非數字標簽
#把行標簽轉化為非數字類型 df.index=['a','b','c'] #輸出第a、b行,第0到2列的數據 #方式1 df.loc[['a','b'],0:2]#可把loc理解為遍歷字符串類型,0:2則表示標簽為0,1,2三列 #方式2 df.iloc[0:2,0:3]#iloc遍歷的是數字,0:2表示的是0和1,0:3表示0,1,2。
兩者輸出結果均為:
3.4 其他用法
一般情況下,表的行為從0編號的數字類型,列為具體的字符串類型。行的數字容易確定,列的列名容易確定。
#將行換成0 1 2編號 df.index=[0,1,2] #列標簽換成A B C D df.columns=['A','B','C','D'] df.iloc[1]['A']#實現輸出第1行第A列的數據
輸出結果為4。
如果要輸出第1行,第AB列,使用df.iloc[1][['A','B']],這裡一定要註意'A','B'是作為一個列表輸入的,右側一共有兩個中括號。
輸出結果:
A 4
B 5
Name: 1, dtype: int32
df.iloc[1][['A','B']]等價於df.iloc[1,0:2],但是很多情況下我們不知道具體列名對應的數字,所以采用第一種方法可以提高編程效率。
總結
到此這篇關於Python學習之.iloc與.loc的區別、聯系和用法的文章就介紹到這瞭,更多相關Python .iloc與.loc用法內容請搜索LevelAH以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持LevelAH!
推薦閱讀:
- Python Pandas中loc和iloc函數的基本用法示例
- pandas對齊運算的實現示例
- python數學建模是加深Numpy和Pandas學習
- python數學建模之三大模型與十大常用算法詳情
- python基礎知識之索引與切片詳解