加入两个数据框并将所有列保留在熊猫中

伊克巴尔小学

我正在尝试使用 Pandas 在 python 中执行类似 join 的 sql 语句。

我有这两个数据框

df1:

id  name
7   MPS
10  MCM
11  MIB
12  NEW-MCM-DEV
15  SAMS
16  NEW-MCM-VIT

df2:

main_id numberOfNodes tier_id   tier_name               
7       2             29        MPS-Online           
7       0             247       Offline-b24-settle  
7       0             246       Offline-bank-data-feed  
7       1             256       Offline-Citynet-Recon   
7       1             433       WAS 
10      8             26        APP 
10      2             296       BATCH   
10      2             358       BBO 

我想根据 id (df1) 和 main_id(df2) 加入这 2 个数据帧。

我想要的输出是

main_id numberOfNodes tier_id   tier_name               name
7       2             29        MPS-Online              MPS
7       0             247       Offline-b24-settle      MPS
7       0             246       Offline-bank-data-feed  MPS 
7       1             256       Offline-Citynet-Recon   MPS
7       1             433       WAS                     MPS
10      8             26        APP                     MCM
10      2             296       BATCH                   MCM
10      2             358       BBO                     MCM

我尝试使用

df2.merge(df1, left_on='main_id', right_on='id')

并尝试使用

df2.join(df1, on=['main_id'], how='outer')

但没有工作,因为 df1 上的名称字段未显示在输出中。有什么办法可以实现这一目标吗?

卢卡斯·阿劳霍

您可以使用熊猫功能concat

沿特定轴连接 Pandas 对象,沿其他轴使用可选的设置逻辑。

有一些方法可以使用它,首先以对问题提出的方式使用:

pd.concat([df1, df4], axis=1, sort=False)

在这种情况下,pandas 将用 NaN 填充缺失值。例子:

在此处输入图片说明

如果您更喜欢忽略缺失值的行,您可以使用:

pd.concat([df1, df4], axis=1, join='inner')

在这种情况下,数据帧之间的连接将作为 SQL 的内部连接工作。例子:

在此处输入图片说明

如果你想保留一些数据框结构只是用新列完成这个结构,你可以使用:

pd.concat([df1, df4], axis=1, join_axes=[df1.index])

在这种情况下,生成的数据帧将具有相同的行,df1但有一些额外的df4. 例子:

在此处输入图片说明

可以在此链接上找到更多信息

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

合并两个数据框,保留所有列

来自分类Dev

将所有数据保留在数据框中,但 2 列中的特定行除外

来自分类Dev

如何在熊猫数据框上使用.size函数,同时仍将所有列保留在组中

来自分类Dev

合并两个分支并将两个分支保留在分散的目录中

来自分类Dev

在DF中对数据进行分组,但将所有列保留在Python中

来自分类Dev

支持熊猫中的两个数据框列

来自分类Dev

为日期子集数据框架,并将所有以后的日期保留在data.table中

来自分类Dev

将具有某些值的行保留在数据框中,并删除所有其他行[R]

来自分类Dev

大熊猫加入两个数据框,如果其他数据框中不存在某些行,则保留来自一个数据集的数据

来自分类Dev

在jupyter笔记本中将多余的空格保留在熊猫数据框的显示中

来自分类Dev

在Pandas / Python中合并两个数据框,使所有列均不包含数据框1

来自分类Dev

将所有索引保留在多级熊猫groupby中

来自分类Dev

遍历文件并将数据保留在列表中-Python

来自分类Dev

熊猫:减去两个数据框时的所有NaN

来自分类Dev

试图使两个按钮保留在网格的状态列中

来自分类Dev

在excel中取消过滤表中的所有列并将过滤器保留在列中的正确vba是什么?

来自分类Dev

合并两个数据框并保留唯一的列

来自分类Dev

如何在python熊猫中找到带有多索引的两个数据框列中的最小值?

来自分类Dev

匹配两个数据框的列并将其存储在新列中

来自分类Dev

根据熊猫中两列的组合比较两个数据框

来自分类Dev

合并两个数据框并从正确的数据框中检索所有信息

来自分类Dev

如何仅将字符串保留在数据框列中

来自分类Dev

如何仅将数字保留在数据框的列的字符串中?

来自分类Dev

将行保留在数据框中,用于列中值的最后 n 次出现

来自分类Dev

用列熊猫分组的两个数据框的划分

来自分类Dev

是否可以压缩两个不同大小的流并将其余部分保留在Scala中?

来自分类Dev

如何检查两个数据框(熊猫)中多个列的列值?

来自分类Dev

通过将数据集中的所有变量保留在r中来计算均值

来自分类Dev

熊猫合并具有不同列的两个数据框

Related 相关文章

  1. 1

    合并两个数据框,保留所有列

  2. 2

    将所有数据保留在数据框中,但 2 列中的特定行除外

  3. 3

    如何在熊猫数据框上使用.size函数,同时仍将所有列保留在组中

  4. 4

    合并两个分支并将两个分支保留在分散的目录中

  5. 5

    在DF中对数据进行分组,但将所有列保留在Python中

  6. 6

    支持熊猫中的两个数据框列

  7. 7

    为日期子集数据框架,并将所有以后的日期保留在data.table中

  8. 8

    将具有某些值的行保留在数据框中,并删除所有其他行[R]

  9. 9

    大熊猫加入两个数据框,如果其他数据框中不存在某些行,则保留来自一个数据集的数据

  10. 10

    在jupyter笔记本中将多余的空格保留在熊猫数据框的显示中

  11. 11

    在Pandas / Python中合并两个数据框,使所有列均不包含数据框1

  12. 12

    将所有索引保留在多级熊猫groupby中

  13. 13

    遍历文件并将数据保留在列表中-Python

  14. 14

    熊猫:减去两个数据框时的所有NaN

  15. 15

    试图使两个按钮保留在网格的状态列中

  16. 16

    在excel中取消过滤表中的所有列并将过滤器保留在列中的正确vba是什么?

  17. 17

    合并两个数据框并保留唯一的列

  18. 18

    如何在python熊猫中找到带有多索引的两个数据框列中的最小值?

  19. 19

    匹配两个数据框的列并将其存储在新列中

  20. 20

    根据熊猫中两列的组合比较两个数据框

  21. 21

    合并两个数据框并从正确的数据框中检索所有信息

  22. 22

    如何仅将字符串保留在数据框列中

  23. 23

    如何仅将数字保留在数据框的列的字符串中?

  24. 24

    将行保留在数据框中,用于列中值的最后 n 次出现

  25. 25

    用列熊猫分组的两个数据框的划分

  26. 26

    是否可以压缩两个不同大小的流并将其余部分保留在Scala中?

  27. 27

    如何检查两个数据框(熊猫)中多个列的列值?

  28. 28

    通过将数据集中的所有变量保留在r中来计算均值

  29. 29

    熊猫合并具有不同列的两个数据框

热门标签

归档