无需重复即可添加到系列中的有效方法

查克·卡尔森

我需要经常向数据框(或序列,如果这样更有效)中添加一个,同时确保添加的内容不会创建重复项。随着数据帧的增长,通过简单地将其隐藏然后调用drop_duplicates,这似乎会变得效率低下,因为需要为每个数据集检查整个数据集是否存在重复项。

数据只有两列,因此我猜测将其中一列转换为索引可能会加快速度。(或将两列都放入分层索引中)熊猫有禁止重复索引的方法吗?

这是一个示例问题:

print accumulating_result
  c1  c2
0  A  x1
1  B  x2
2  B  x3
3  C  x4

print new
  c1  c2
0  B  x3
1  C  x4
2  C  x5

执行将new添加到accumulating_result并获得:

print accumulating_result
  c1  c2
0  A  x1
1  B  x2
2  B  x3
3  C  x4
4  C  x5

值多少钱,c2列中的每个条目都是唯一的。

有任何想法吗?

亨利

您可以使用combine_first()

data1 = """  c1  c2
0  A  x1
1  B  x2
2  B  x3
3  C  x4"""


data2 = """  c1  c2
0  X  x3
1  Y  x4
2  Z  x5"""

import io
import pandas as pd

df1 = pd.read_csv(io.BytesIO(data1), delim_whitespace=True)
df2 = pd.read_csv(io.BytesIO(data2), delim_whitespace=True)

df1.set_index("c2", inplace=True)
df2.set_index("c2", inplace=True)

df1.combine_first(df2)

输出:

   c1
c2   
x1  A
x2  B
x3  B
x4  C
x5  Z

但每次都会复制所有数据。也许使用HDF5或数据库更好。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

EF Core:一种无需事务即可将多个不相关的行添加到数据库中的有效方法?

来自分类Dev

将一列添加到 r 中的列表列的有效方法

来自分类Dev

无需推送即可将项目添加到数组中

来自分类Dev

有没有更有效的方法将相同的视图添加到UICollectionViewCell而无需手动指定每个视图?

来自分类Dev

无需差异即可有效存储差异信息元组的有效方法

来自分类Dev

有没有更有效的方法添加到数组?

来自分类Dev

比较不同表中数据并将其添加到第三种的最有效方法

来自分类Dev

如何有效地匹配来自 2 个系列的值并将它们添加到数据框中

来自分类Dev

如何有效地将字典中的数据添加到数据框中?

来自分类Dev

将索引添加到Pandas系列中的重复项

来自分类Dev

搜索并添加到每个循环不断增长的大型列表的最有效方法

来自分类Dev

内存有效的方法,以将列添加到.csv文件

来自分类Dev

将映射添加到美学值的有效方法

来自分类Dev

有效地将信息添加到列表中。Linq联盟?

来自分类Dev

如何有效地从vim中将文件添加到vim的args列表中?

来自分类Dev

有效地将多个元素添加到C#中List的开头

来自分类Dev

如何有效地从vim中将文件添加到vim的args列表中?

来自分类Dev

如何有效地将常量值添加到GWT的ListBox中?

来自分类Dev

有效地将多个元素添加到C#中List的开头

来自分类Dev

无法有效地将类添加到 Roslyn 中的命名空间

来自分类Dev

C / C ++-无需使用内置函数即可旋转数组的有效方法(作业)

来自分类Dev

无需压缩即可将文件添加到zip存档

来自分类Dev

无需密码即可将用户添加到Firebase

来自分类Dev

在指针向量中添加非重复值的最有效方法

来自分类Dev

有效的方式来有条件地将项目添加到HashMap中

来自分类Dev

在 C# 中使用数据将标识列添加到数据表的最有效方法

来自分类Dev

在bash中将非唯一数据添加到唯一数据的最有效方法

来自分类Dev

我如何(有效地)将向量添加到Julia中矩阵的每一行?

来自分类Dev

如何有效地将常量值添加到GWT中的列表框?

Related 相关文章

  1. 1

    EF Core:一种无需事务即可将多个不相关的行添加到数据库中的有效方法?

  2. 2

    将一列添加到 r 中的列表列的有效方法

  3. 3

    无需推送即可将项目添加到数组中

  4. 4

    有没有更有效的方法将相同的视图添加到UICollectionViewCell而无需手动指定每个视图?

  5. 5

    无需差异即可有效存储差异信息元组的有效方法

  6. 6

    有没有更有效的方法添加到数组?

  7. 7

    比较不同表中数据并将其添加到第三种的最有效方法

  8. 8

    如何有效地匹配来自 2 个系列的值并将它们添加到数据框中

  9. 9

    如何有效地将字典中的数据添加到数据框中?

  10. 10

    将索引添加到Pandas系列中的重复项

  11. 11

    搜索并添加到每个循环不断增长的大型列表的最有效方法

  12. 12

    内存有效的方法,以将列添加到.csv文件

  13. 13

    将映射添加到美学值的有效方法

  14. 14

    有效地将信息添加到列表中。Linq联盟?

  15. 15

    如何有效地从vim中将文件添加到vim的args列表中?

  16. 16

    有效地将多个元素添加到C#中List的开头

  17. 17

    如何有效地从vim中将文件添加到vim的args列表中?

  18. 18

    如何有效地将常量值添加到GWT的ListBox中?

  19. 19

    有效地将多个元素添加到C#中List的开头

  20. 20

    无法有效地将类添加到 Roslyn 中的命名空间

  21. 21

    C / C ++-无需使用内置函数即可旋转数组的有效方法(作业)

  22. 22

    无需压缩即可将文件添加到zip存档

  23. 23

    无需密码即可将用户添加到Firebase

  24. 24

    在指针向量中添加非重复值的最有效方法

  25. 25

    有效的方式来有条件地将项目添加到HashMap中

  26. 26

    在 C# 中使用数据将标识列添加到数据表的最有效方法

  27. 27

    在bash中将非唯一数据添加到唯一数据的最有效方法

  28. 28

    我如何(有效地)将向量添加到Julia中矩阵的每一行?

  29. 29

    如何有效地将常量值添加到GWT中的列表框?

热门标签

归档