通过汇总两列来过滤熊猫数据框

水平

我有一个熊猫数据框。这是前五行:

      InvoiceNo StockCode                          Description  Quantity      InvoiceDate       UnitPrice  CustomerID         Country  
    0    536365    85123A   WHITE HANGING HEART T-LIGHT HOLDER         6   2010-12-01 08:26:00       2.55     17850.0  United Kingdom  
    1    536365     71053                  WHITE METAL LANTERN         6   2010-12-01 08:26:00       3.39     17850.0  United Kingdom
    2    536365    84406B       CREAM CUPID HEARTS COAT HANGER         8   2010-12-01 08:26:00       2.75     17850.0  United Kingdom
    3    536365    84029G  KNITTED UNION FLAG HOT WATER BOTTLE         6   2010-12-01 08:26:00       3.39     17850.0  United Kingdom
    4    536365    84029E       RED WOOLLY HOTTIE WHITE HEART.         6   2010-12-01 08:26:00       3.39     17850.0  United Kingdom

我想通过组StockCodeCustomerID和,和Quantity然后,我想把所有的StockCode/CustomerID对都舍去为负。所需的最终产品是原始数据帧,其中删除了与这些StockCode / CustomerID对相对应的行。

我有一个可行的解决方案:

retail_df.groupby(['CustomerID','StockCode']).filter(lambda x: x['Quantity'].sum() >= 0)

但是,我的笔记本电脑需要四分钟才能运行它。有406829行。有没有更快的方法?

格热哥兹·斯基宾斯基

这应该可以解决问题:

df2=retail_df.groupby(['CustomerID','StockCode'])["Quantity"].sum().ge(0)

retail_df=retail_df.set_index(['CustomerID','StockCode']).loc[df2.loc[df2].index].reset_index(drop=False)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

通过对熊猫的不同列应用条件来过滤数据框

来自分类Dev

通过从包含列表熊猫的列中删除重复项来过滤数据框

来自分类Dev

通过比较两个包含不同格式电话号码的数据框列来过滤数据框

来自分类Dev

通过比较两个数据框来过滤常见字符串

来自分类Dev

选择列的子集(即,通过收集列键来过滤数据框)

来自分类Dev

尝试通过在其他列上应用条件来过滤出数据框中的列

来自分类Dev

如何通过使用列号而不是标签来过滤R数据框?

来自分类Dev

Pandas - 如何通过对多列值的正则表达式比较来过滤数据框

来自分类Dev

通过在一个按钮中使用两列来过滤datagridview中的数据

来自分类Dev

如何通过部分标签过滤熊猫数据框列

来自分类Dev

汇总熊猫数据框中的列组

来自分类Dev

汇总来自不同数据框的列的熊猫

来自分类Dev

通过ID列表过滤熊猫数据框

来自分类Dev

通过熊猫数据框中的列中的重复值进行汇总

来自分类Dev

通过熊猫数据框中的列中的重复值进行汇总

来自分类Dev

使用字典作为查找参考来过滤熊猫数据框中的值

来自分类Dev

如何使用运算符作为for循环中的变量来过滤熊猫数据框

来自分类Dev

使用熊猫从数据框的两列中过滤非数字数据

来自分类Dev

熊猫过滤分组数据并汇总

来自分类Dev

根据日期列熊猫过滤数据框

来自分类Dev

过滤熊猫数据框中的两列,其中一列代表通话时间

来自分类Dev

过滤熊猫数据框中的两列,其中一列代表通话时间

来自分类Dev

通过X列中的最小正值计数(按Y列中的值汇总)过滤熊猫数据集

来自分类常见问题

熊猫:如何通过大于考虑索引的方式来过滤列

来自分类Dev

通过在文本块中查找关键字来过滤数据框

来自分类Dev

根据其他数据框过滤熊猫数据框列

来自分类Dev

熊猫数据框过滤

来自分类Dev

比较熊猫数据框中的两列

来自分类Dev

连接熊猫数据框中的两列

Related 相关文章

  1. 1

    通过对熊猫的不同列应用条件来过滤数据框

  2. 2

    通过从包含列表熊猫的列中删除重复项来过滤数据框

  3. 3

    通过比较两个包含不同格式电话号码的数据框列来过滤数据框

  4. 4

    通过比较两个数据框来过滤常见字符串

  5. 5

    选择列的子集(即,通过收集列键来过滤数据框)

  6. 6

    尝试通过在其他列上应用条件来过滤出数据框中的列

  7. 7

    如何通过使用列号而不是标签来过滤R数据框?

  8. 8

    Pandas - 如何通过对多列值的正则表达式比较来过滤数据框

  9. 9

    通过在一个按钮中使用两列来过滤datagridview中的数据

  10. 10

    如何通过部分标签过滤熊猫数据框列

  11. 11

    汇总熊猫数据框中的列组

  12. 12

    汇总来自不同数据框的列的熊猫

  13. 13

    通过ID列表过滤熊猫数据框

  14. 14

    通过熊猫数据框中的列中的重复值进行汇总

  15. 15

    通过熊猫数据框中的列中的重复值进行汇总

  16. 16

    使用字典作为查找参考来过滤熊猫数据框中的值

  17. 17

    如何使用运算符作为for循环中的变量来过滤熊猫数据框

  18. 18

    使用熊猫从数据框的两列中过滤非数字数据

  19. 19

    熊猫过滤分组数据并汇总

  20. 20

    根据日期列熊猫过滤数据框

  21. 21

    过滤熊猫数据框中的两列,其中一列代表通话时间

  22. 22

    过滤熊猫数据框中的两列,其中一列代表通话时间

  23. 23

    通过X列中的最小正值计数(按Y列中的值汇总)过滤熊猫数据集

  24. 24

    熊猫:如何通过大于考虑索引的方式来过滤列

  25. 25

    通过在文本块中查找关键字来过滤数据框

  26. 26

    根据其他数据框过滤熊猫数据框列

  27. 27

    熊猫数据框过滤

  28. 28

    比较熊猫数据框中的两列

  29. 29

    连接熊猫数据框中的两列

热门标签

归档