迭代groupby Pandas数据框的更有效方法？

debugcn 发表于 Dev

欧巴

我有这个片段代码，ID将熊猫数据框的分组列并在结果数据框中附加唯一ID的所有最高薪水。该代码可以工作，但是对于较大的文件来说有点慢。我想知道是否有人可以提出一种更有效的方法。

groupe = df.groupby("ID")
t = (group.sort_values(by="Salary", ascending=False)[:1] for yr, group in groupe)
result = pd.DataFrame() 
     for i in t:
        result = result.append(i)

肖瓦尔特

df.groupby('ID').max()

然后，您可以选择薪金列。

编辑

如果要保留所有其他列，即使是非数字列，也应执行以下操作：

df.sort_values(by="Salary", ascending=False).groupby('ID').first()

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-19

我来说两句

0条评论

登录后参与评论

来自分类Dev

更有效的迭代方法

来自分类Dev

迭代多个列表/字典的更有效方法？

来自分类Dev

从Pandas中的groupby .agg（）或.apply（）有效地创建全新的数据框？

来自分类Dev

有没有更有效的方法来重构Ruby上哈希的迭代？

来自分类Dev

查找两个可迭代对象共享的匹配值数量的更有效方法？

来自分类Dev

什么是迭代嵌套对象集合的更干净或更有效的方法

来自分类Dev

在重复迭代期间更有效的改组

来自分类Dev

在大熊猫中使用groupby以获得比例的更有效方法

来自分类Dev

附加数据框的更有效方法

来自分类Dev

如何迭代从groupby（）。size（）生成的Pandas Series

来自分类Dev

pandas groupby：有效的条件聚合？

来自分类Dev

pandas groupby：有效的条件聚合？

来自分类Dev

迭代熊猫中行的有效方法

来自分类Dev

当打印出树中的所有节点时，递归或迭代是否更有效？

来自分类Dev

在 VBa 中迭代行时，如何使带有 If 语句的 For 循环更有效？

来自分类Dev

什么是更有效的迭代列表并调用函数或将列表传递给函数

来自分类Dev

使用.agg保持groupby之后的所有列（许多列）更有效

来自分类Dev

将pandas数据框函数转换为更有效的函数

来自分类Dev

在 groupby 之后迭代 sum 的正确方法是什么

来自分类Dev

通过消除重复来编写Pandas groupby代码的有效方法

来自分类Dev

pandas groupby：有效地构建多个列

来自分类Dev

从迭代ArrayList内部删除对象的最有效方法

来自分类Dev

每X次迭代跳过代码的有效方法？

来自分类Dev

JS：通过迭代筛选结果的最有效方法？

来自分类Dev

迭代3D numpy数组的有效方法

来自分类Dev

迭代大向量的最有效方法？

来自分类Dev

从迭代ArrayList内部删除对象的最有效方法

来自分类Dev

为特定成员迭代数组的有效方法

来自分类Dev

每X次迭代跳过代码的有效方法？

Related 相关文章

文章