加入两个数据框并将所有列保留在熊猫中

debugcn 发表于 Dev

伊克巴尔小学

我正在尝试使用 Pandas 在 python 中执行类似 join 的 sql 语句。

我有这两个数据框

df1：

id  name
7   MPS
10  MCM
11  MIB
12  NEW-MCM-DEV
15  SAMS
16  NEW-MCM-VIT

df2：

main_id numberOfNodes tier_id   tier_name               
7       2             29        MPS-Online           
7       0             247       Offline-b24-settle  
7       0             246       Offline-bank-data-feed  
7       1             256       Offline-Citynet-Recon   
7       1             433       WAS 
10      8             26        APP 
10      2             296       BATCH   
10      2             358       BBO

我想根据 id (df1) 和 main_id(df2) 加入这 2 个数据帧。

我想要的输出是

main_id numberOfNodes tier_id   tier_name               name
7       2             29        MPS-Online              MPS
7       0             247       Offline-b24-settle      MPS
7       0             246       Offline-bank-data-feed  MPS 
7       1             256       Offline-Citynet-Recon   MPS
7       1             433       WAS                     MPS
10      8             26        APP                     MCM
10      2             296       BATCH                   MCM
10      2             358       BBO                     MCM

我尝试使用

df2.merge(df1, left_on='main_id', right_on='id')

并尝试使用

df2.join(df1, on=['main_id'], how='outer')

但没有工作，因为 df1 上的名称字段未显示在输出中。有什么办法可以实现这一目标吗？

卢卡斯·阿劳霍

您可以使用熊猫功能concat。

沿特定轴连接 Pandas 对象，沿其他轴使用可选的设置逻辑。

有一些方法可以使用它，首先以对问题提出的方式使用：

pd.concat([df1, df4], axis=1, sort=False)

在这种情况下，pandas 将用 NaN 填充缺失值。例子：

如果您更喜欢忽略缺失值的行，您可以使用：

pd.concat([df1, df4], axis=1, join='inner')

在这种情况下，数据帧之间的连接将作为 SQL 的内部连接工作。例子：

如果你想保留一些数据框结构只是用新列完成这个结构，你可以使用：

pd.concat([df1, df4], axis=1, join_axes=[df1.index])

在这种情况下，生成的数据帧将具有相同的行，df1但有一些额外的df4. 例子：

可以在此链接上找到更多信息。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-24

我来说两句

0条评论

登录后参与评论

来自分类Dev

合并两个数据框，保留所有列

来自分类Dev

将所有数据保留在数据框中，但 2 列中的特定行除外

来自分类Dev

如何在熊猫数据框上使用.size函数，同时仍将所有列保留在组中

来自分类Dev

合并两个分支并将两个分支保留在分散的目录中

来自分类Dev

在DF中对数据进行分组，但将所有列保留在Python中

来自分类Dev

支持熊猫中的两个数据框列

来自分类Dev

为日期子集数据框架，并将所有以后的日期保留在data.table中

来自分类Dev

将具有某些值的行保留在数据框中，并删除所有其他行[R]

来自分类Dev

大熊猫加入两个数据框，如果其他数据框中不存在某些行，则保留来自一个数据集的数据

来自分类Dev

在jupyter笔记本中将多余的空格保留在熊猫数据框的显示中

来自分类Dev

在Pandas / Python中合并两个数据框，使所有列均不包含数据框1

来自分类Dev

将所有索引保留在多级熊猫groupby中

来自分类Dev

遍历文件并将数据保留在列表中-Python

来自分类Dev

熊猫：减去两个数据框时的所有NaN

来自分类Dev

试图使两个按钮保留在网格的状态列中

来自分类Dev

在excel中取消过滤表中的所有列并将过滤器保留在列中的正确vba是什么？

来自分类Dev

合并两个数据框并保留唯一的列

来自分类Dev

如何在python熊猫中找到带有多索引的两个数据框列中的最小值？

来自分类Dev

匹配两个数据框的列并将其存储在新列中

来自分类Dev

根据熊猫中两列的组合比较两个数据框

来自分类Dev

合并两个数据框并从正确的数据框中检索所有信息

来自分类Dev

如何仅将字符串保留在数据框列中

来自分类Dev

如何仅将数字保留在数据框的列的字符串中？

来自分类Dev

将行保留在数据框中，用于列中值的最后 n 次出现

来自分类Dev

用列熊猫分组的两个数据框的划分

来自分类Dev

是否可以压缩两个不同大小的流并将其余部分保留在Scala中？

来自分类Dev

如何检查两个数据框（熊猫）中多个列的列值？

来自分类Dev

通过将数据集中的所有变量保留在r中来计算均值

来自分类Dev

熊猫合并具有不同列的两个数据框

Related 相关文章

文章