python進行數據合並concat/merge
前言:
兩個表中的數據,要根據關鍵字段,進行合並。
在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。
1、pd.concat
pd.concat 函數:
- 拼接的對象可以是series,還可以是dataframe
- 拼接對象的個數不受限axis 控制拼接方向(既支持上下拼接,也支持左右拼接)
- 左右拼接 axis=1,左右拼接的依據是行索引;上下拼接 axis =0 ,拼接依據是列名,默認是上下拼接
- join 指定拼接方法
- join=“inner” 內聯,表示保留兩個表共有的行索引
- join=“outer” 外聯,表示保留兩個表所有的行索引,默認外聯
#導入需要的包 import pandas as pd
#創建需要的數據集:產品表 dict1={"產品編號":["CP13","CP14","CP15","CP16","CP17"],"產品名稱":["產品A003","產品A004","產品A005","產品A006","產品A007"]} df1 = pd.DataFrame(dict1) df1
#創建需要的數據集:詳情表 dict2={"訂單編號":["20220913","20220914","20220915","20220915"], "產品編號":["CP13","CP14","CP15","CP16"], "產品銷量":[13,24,45,32], "負責人":["張三","趙六","李八","李八"]} df2 = pd.DataFrame(dict2) df2
pd.concat([df1,df2])#默認上下拼接,拼接依據是列名;默認外聯,保留兩個表都有的索引信息
pd.concat([df1,df2],ignore_index=True)#重置行索引
#左右拼接的依據是行索引 axis默認是0上下拼接,1為左右拼接;默認外聯(join = 'outer') pd.concat([df1,df2],axis=1)
#join指定瞭拼接方法,內聯,表示保留兩個表共有的行索引 pd.concat([df1,df2],axis=1,join="inner")
2、 df.append
和concat上下拼接的結果類似
df1.append(df2)
3、 pd.merge()
- 拼接對象是dataframe或者series,左表必須是datafram
- 拼接的數量隻能是兩個
- 拼接方向隻能左右拼
#left_on寫左表進行拼接的字段,right_on寫右表要進行拼接的字段 pd.merge(df1,df2,left_on="產品編號",right_on="產品編號",how = 'right')
#若兩表拼接字段名完全一樣,可寫一個on pd.merge(df1,df2,on="產品編號")
4、 df.join
和concat左右拼接的結果類似
df1.join(df2, lsuffix='_b', rsuffix='_a')
總結
到此這篇關於python進行數據合並concat/merge的文章就介紹到這瞭,更多相關python數據合並內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- pandas中DataFrame數據合並連接(merge、join、concat)
- python pandas數據處理教程之合並與拼接
- 關於python DataFrame的合並方法總結
- Pandas實現Dataframe的合並
- Python數據合並的concat函數與merge函數詳解