Python學習之.iloc與.loc的區別、聯系和用法

最近接觸到數據科學,需要對一些數據表進行分析,觀察到代碼中一會出現loc一會又出現iloc,下面對兩者的用法給出我的一些理解。

1.聯系

(1)操作對象相同:loc和iloc都是對DataFrame類型進行操作;

(2)完成目的相同:二者都是用於選取DataFrame中對應行或列中的元素。

2.區別

loc和iloc索引的行列標簽類型不同。

iloc使用順序數字來索引數據,而不能使用字符型的標簽來索引數據;註意:這裡的順序數字是指從0開始計數!

loc使用實際設置的索引來索引數據。但行列名為數字時,loc也可以索引數字,但這裡的數字不一定從0開始編號,是對應具體行列名的數字!

3.用法

下面用代碼來講解兩者的用法。

3.1行列全為從0開始順序編號

import pandas as pd
import numpy as np
 
a = np.arange(12).reshape(3,4)
#將a轉化為DataFrame類型
df = pd.DataFrame(a)
#展示df
df

由於未給df的行列命名,默認從0開始編號,所以這個時候使用loc和iloc結果是一樣的。

索引為一個數,默認輸出行
print(df.loc[0])#輸出第0行元素
print(df.iloc[0])#輸出第0行元素

 兩者輸出結果都為:

0    0
1    1
2    2
3    3
Name: 0, dtype: int32

輸出結果為df第0行元素,結果中第一列表示列名,第二列表示具體的值。如果隻需要輸出某一列,輸入df.loc[:,0]表示輸出第0列。

如果需要輸出第0到2列的數據。

#方式1
df.loc[:,0:2]#可把loc理解為遍歷字符串類型,0:2則表示標簽為0,1,2三列
#方式2
df.iloc[:,0:3]#iloc遍歷的數數字,python中0:3對應0,1,和2

輸出結果均為:

3.2有一行或列不是從0順序編號

#把行標簽換成其他數字編號
df.index=[2,5,7]
df.loc[2]

此時df變為:

 輸出結果為:

0    0
1    1
2    2
3    3
Name: 2, dtype: int32

輸出結果對應的是列標簽為“2”所在的行。

我們繼續用df.iloc[2]輸出結果:

0     8
1     9
2    10
3    11
Name: 7, dtype: int32

可見輸出的是第2行的數據。

在這裡我們能大概對loc和iloc的用法有瞭一定的瞭解。

3.3行或者列為非數字標簽

#把行標簽轉化為非數字類型
df.index=['a','b','c']
#輸出第a、b行,第0到2列的數據
#方式1
df.loc[['a','b'],0:2]#可把loc理解為遍歷字符串類型,0:2則表示標簽為0,1,2三列
#方式2
df.iloc[0:2,0:3]#iloc遍歷的是數字,0:2表示的是0和1,0:3表示0,1,2。

兩者輸出結果均為:

3.4 其他用法

一般情況下,表的行為從0編號的數字類型,列為具體的字符串類型。行的數字容易確定,列的列名容易確定。

#將行換成0 1 2編號
df.index=[0,1,2]
#列標簽換成A B C D
df.columns=['A','B','C','D']
df.iloc[1]['A']#實現輸出第1行第A列的數據

輸出結果為4。

如果要輸出第1行,第AB列,使用df.iloc[1][['A','B']],這裡一定要註意'A','B'是作為一個列表輸入的,右側一共有兩個中括號。

輸出結果:

A    4
B    5
Name: 1, dtype: int32

df.iloc[1][['A','B']]等價於df.iloc[1,0:2],但是很多情況下我們不知道具體列名對應的數字,所以采用第一種方法可以提高編程效率。

總結

到此這篇關於Python學習之.iloc與.loc的區別、聯系和用法的文章就介紹到這瞭,更多相關Python .iloc與.loc用法內容請搜索LevelAH以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持LevelAH!

推薦閱讀: