仅将数据帧中的新值附加到 Pandas 中的另一个数据帧

debugcn 发表于 Dev

斯里拉姆 TP

我有一个非常大的数据框。我还有一个小数据框。

这两个数据框都将具有相同的列。

小数据框中的一些行已经存在于大数据框中。我想将小数据框附加到大数据框，以便大数据框中没有重复项。

我可以简单地追加，然后删除重复项。但这会导致内存浪费，将重复的数据帧保留在内存中。

有没有其他方法可以有效地解决这个问题。？

劳纳克·贾恩

数据：

df1 = pd.DataFrame({'a': [1,2,3,4,5,6,7]})
df2 = pd.DataFrame({'a': [3,8,4,9]})

使用合并来获得唯一的行，

df3 = df2.merge(df1, how='left', indicator=True)

    a     _merge
0   3       both
1   8  left_only
2   4       both
3   9  left_only

现在，选择带有'left_only', 的行

df3 =df3[df3._merge == 'left_only'].iloc[:,:-1]

最后，附加它们。

df1 = pd.concat([df1, df3], ignore_index=True)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-21

我来说两句

0条评论

登录后参与评论

来自分类Dev

使用一个数据帧匹配 Pandas 中另一个数据帧中 x 的值并返回 y

来自分类Dev

根据来自另一个数据帧的数据为 Pandas 数据帧中的列赋值

来自分类Dev

将值从一个数据帧列传递到Pandas中的另一数据帧

来自分类Dev

Python Pandas：如何根据条件库中的另一个数组替换数据帧中的值

来自分类Dev

用来自另一个数据帧的匹配 ID 替换 Pandas 中的单元格值

来自分类Dev

python - 如何将数据帧与python中pandas中另一个数据帧的子集交集进行比较？

来自分类Dev

python pandas检查值在另一个数据帧的范围内

来自分类Dev

pandas：从基于列的另一个数据帧中查找每列的记录并除以标量

来自分类Dev

Pandas - 用来自另一个数据帧的值填充一个数据帧的每一行

来自分类Dev

Python Pandas - 将带有“系列”的数据帧加入另一个数据帧

来自分类Dev

根据另一个数据帧中的值将数据帧的列相乘

来自分类Dev

在 R 中动态地将一个数据帧附加到另一个数据帧上

来自分类Dev

Pandas 在一个数据帧上给出 IndexError 但不在另一个类似的数据帧上给出

来自分类Dev

如何从 Pandas 数据帧中的引用中提取值，然后将帧“上升”到另一个指定值？

来自分类Dev

合并数据帧，以便将一个数据帧中的值插入到另一个数据帧中匹配的行号中

来自分类Dev

用另一个不同大小的 Pandas 数据帧减去 Pandas 数据帧

来自分类Dev

根据R中的两个匹配条件，将值从一个数据帧添加到另一个数据帧

来自分类Dev

将pandas.DataFrame.GroupBy结果附加到另一个数据框

来自分类Dev

将一个数据帧切片到另一个数据帧中

来自分类Dev

将一个数据帧附加到另一个

来自分类Dev

Python 3.4 - Pandas - 基于包含重复项的另一个数据帧的列提取行

来自分类Dev

Pandas 基于另一个单索引数据帧查询多索引数据帧

来自分类Dev

Python Pandas数据框-在另一个数据框中优化对ID的搜索

来自分类Dev

在Pandas中将一个数据帧中的行转置为另一数据帧中的列的最佳方法？

来自分类Dev

根据Pandas中的公共列将一个数据帧拆分为多个子数据帧

来自分类Dev

检查一个数据帧中的行是否在另一个数据帧中

来自分类Dev

根据Pandas中的ID将列值从一个数据框复制到另一个数据框

来自分类Dev

根据另一个数据帧中的多个条件过滤数据帧

来自分类Dev

根据另一个数据帧在R数据帧中创建变量

Related 相关文章

文章