十分鐘輕松掌握dataframe數據選擇

數據初始化

import pandas as pd
import numpy as np
a=np.array([['北京','北方','一線','非沿海'],['杭州','南方','二線','非沿海'],['深圳','南方','一線','沿海'],['煙臺','北方','三線','沿海']])
df=pd.DataFrame(a,index=['一','二','三','四'],columns=['城市','地理','級別','是否沿海'])

城市 地理 級別 是否沿海
一 北京 北方 一線 非沿海
二 杭州 南方 二線 非沿海
三 深圳 南方 一線 沿海
四 煙臺 北方 三線 沿海

選擇某一行

通過loc選擇某一行

loc標簽是軸標簽,也就是我們的索引名,使用也非常簡單

df.loc['二']

城市       杭州
地理       南方
級別       二線
是否沿海    非沿海
Name: 二, dtype: object

通過iloc選擇某一行

iloc為整數標簽,類似我們使用的元組列表的索引。比如我們想選擇第二行的數據,第二行的索引則為1.

df.iloc[1]

城市       杭州
地理       南方
級別       二線
是否沿海    非沿海
Name: 二, dtype: object

選擇某一列

最簡單的方法選擇某一列

如果我們知道列索引,那麼選擇某一列則變得十分簡單

df['級別']

一    一線
二    二線
三    一線
四    三線
Name: 級別, dtype: object

通過iloc選則某一列

正如我們上述使用iloc的方法,我們隻需傳入行或者列的索引即可。其實iloc的中括號裡可以輸入兩個參數。前面為行,後面為列中間用逗號隔開。(如果省略瞭逗號,則默認取選擇行)

比如現在我們想選擇第二列,我們隻需在逗號錢輸入: 代表所有的行,後面則輸入1代表第二列

df.iloc[:, 1]

一    北方
二    南方
三    南方
四    北方
Name: 地理, dtype: object

通過loc選擇某一列

和iloc的使用相似,隻不過在數據篩選中我們不再使用行整數索引,而是具體的索引值。

df.loc[:, '是否沿海']

一    非沿海
二    非沿海
三     沿海
四     沿海
Name: 是否沿海, dtype: object

選擇某一行的某幾列或某一列的某一行

其實loc與iloc是dataframe中選擇數據最高效的方式,他的功能也十分強大。我們可以隨意組合。

選擇某一行的某幾列

比如我們現在選擇第二行的中間兩列

df.iloc[1,1:3]

地理    南方
級別    二線
Name: 二, dtype: object

當然我們也可以不使用整數索引

df.loc['二':,'地理':'級別']

 地理 級別
二 南方 二線
三 南方 一線
四 北方 三線

通過行列自由組合去選擇數據

比如我們想選擇第二到三行的第二列和第三列

df.iloc[2:4:, 2:4]

 級別 是否沿海
三 一線 沿海
四 三線 沿海

同樣十分簡單,通過loc使用效果相同,這裡不過多描述

選擇某幾列或者某幾行

選擇某幾列

df.iloc[:,2:4]

級別 是否沿海
一 一線 非沿海
二 二線 非沿海
三 一線 沿海
四 三線 沿海

選擇某幾行

 城市 地理 級別 是否沿海
二 杭州 南方 二線 非沿海
三 深圳 南方 一線 沿海

獲取單個標量值

如果把dataframe看做一個表格,這裡可以看成獲得表格裡某個單元格的值

通過iat去獲取

iat即為整數標簽

df.iat[2,2]

‘一線’

通過at去獲取

at即為具體的索引值去獲取

df.at['三','級別']

‘一線’

到此這篇關於十分鐘輕松掌握dataframe數據選擇的文章就介紹到這瞭,更多相關dataframe數據選擇內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀:

    None Found