python中pandas操作apply返回多列的實現

我們可以用DataFrame的apply函數實現對多列,多行的操作。

需要記住的是,參數axis設為1是對列進行操作,參數axis設為0是對行操作。默認是對行操作。

apply 返回多列

# height = [70, 90, 100, 120, 140, 160, 180, 200,220,240, 260] # 長度為 11
# df.shape   (1000, 11)
# 對df的每一行的每一個元素操作,然後再返回多列
#----------返回多列-----------------
df = df.apply(lambda x: pd.Series([math.atan(i[0]/(i[1])*180/math.pi for i in zip(height, x)]).astype(float), axis=1)
.rename(columns=dict(zip(list(range(0, 11)), df.columns)))

#df['slope'] = df_10min.apply(lambda x: math.atan(210 / (x['ws_260'] - x['ws_50'] + 1e-7))*180/math.pi, axis=1)
import pandas as pd
df_tmp = pd.DataFrame([
    {"a":"data1", "cnt":100},{"a":"data2", "cnt":200},
])

df_tmp
a    cnt
data1    100
data2    200

方法一:使用apply 的參數result_type 來處理
def formatrow(row):
    a = row["a"] + str(row["cnt"])
    b = str(row["cnt"]) + row["a"]
    return a, b 
 
df_tmp[["fomat1", "format2"]] = df_tmp.apply(formatrow, axis=1, result_type="expand")
df_tmp
a    cnt    fomat1    format2
data1    100    data1100    100data1
data2    200    data2200    200data2

方法一:使用zip打包返回結果來處理
df_tmp["fomat1-1"], df_tmp["format2-2"] = zip(*df_tmp.apply(formatrow, axis=1))
df_tmp
a    cnt    fomat1    format2    fomat1-1    format2-2
data1    100    data1100    100data1    data1100    100data1
data2    200    data2200    200data2    data2200    200data2

生成新列

現在有如下一個DataFrame:

np.random.seed(1)
df = pd.DataFrame(np.random.randn(4,2), columns=['A', 'B'])
df
>>>
       A    B
0    1.624345    -0.611756
1    -0.528172    -1.072969
2    0.865408    -2.301539
3    1.744812    -0.761207

對A, B兩列操作,生成C列, 其中C是字符串,由A ± B組成。下面看一下結果就明白瞭。

df['C'] = df.apply(lambda x: '{:.2f}±{:.2f}'.format(x['A'], x['B']), axis=1)

看一下效果

    A    B    C
0    1.624345    -0.611756    1.62±-0.61
1    -0.528172    -1.072969    -0.53±-1.07
2    0.865408    -2.301539    0.87±-2.30
3    1.744812    -0.761207    1.74±-0.76

多行操作舉例

同理可以作用在多行上。

# 對第 10 行進行操作,基於第2、3兩行
df.loc[10] = df.apply(lambda x: '{:.2f}±{:.2f}'.format(x[2], x[3]) )

看一下實現的效果

       A    B
0    1.624345    -0.611756
1    -0.528172    -1.072969
2    0.865408    -2.301539
3    1.744812    -0.761207
10    0.87±1.74    -2.30±-0.76

參考鏈接

[1] pandas的DataFrame使用apply實現對多列,多行操作 2021.12
[2] pandas 的apply返回多列,並賦值 2020.4

到此這篇關於python中pandas操作apply返回多列的實現的文章就介紹到這瞭,更多相關pandas apply返回多列內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: