如何根据行中的特定值和熊猫中的另一列对行进行分组?

特里格杰夫

我想不出一个很好的方法在一个句子中问这个问题,所以我将展示我想做的事情。

假设我有一张桌子,每一行都是某人通过书本出租过程触发的事件。我们有2个活动,购物篮(包含他们想要的书)和结帐(结帐成功且书籍被租用时触发)。我想按名称分组,但也要按结帐事件和之前的每个购物篮事件分组。这是一个仅按名称=“ tim”分组的示例组。

|-------------------------------------------------|
| time | name |  stage   |        payload         |
|-------------------------------------------------|
| 1000 | tim  |  basket  | harrypotter;twilight;  |
|-------------------------------------------------|
| 1001 | tim  |  basket  | harrypotter;           |
|-------------------------------------------------|
| 1002 | tim  | checkout | Order# 123456789       |
|-------------------------------------------------|
| 1003 | tim  |  basket  | pandasfordummies;      |
|-------------------------------------------------|
| 1004 | tim  | checkout | Order# 145246263       |
|-------------------------------------------------|

我的问题是如何分组,以便每个分组中都有1个结帐事件,如下所示:

第一个订单

|-------------------------------------------------|
| time | name |  stage   |        payload         |
|-------------------------------------------------|
| 1000 | tim  |  basket  | harrypotter;twilight;  |
|-------------------------------------------------|
| 1001 | tim  |  basket  | harrypotter;           |
|-------------------------------------------------|
| 1002 | tim  | checkout | Order# 123456789       |
|-------------------------------------------------|

二阶

|-------------------------------------------------|
| time | name |  stage   |        payload         |
|-------------------------------------------------|
| 1003 | tim  |  basket  | pandasfordummies;      |
|-------------------------------------------------|
| 1004 | tim  | checkout | Order# 145246263       |
|-------------------------------------------------|

抱歉,如果措辞太糟糕。

超级头脑

假设您的表格位于pandas数据框中,并且已经按时间和名称排序,则可以使用以下代码:

import numpy as np
import pandas as pd

df = pd.DataFrame({'time': [1000, 1001, 1002, 1003, 1004],
               'name':['tim', 'tim', 'tim', 'tim', 'tim'],
               'stage':['basket', 'basket', 'checkout', 'basket', 'checkout'],
               'payload':['harrypotter;twilight;', 'harrypotter;', 'Order# 123456789', 'pandasfordummies;', 'Order# 145246263']})

orders = np.split(df, np.where(df.stage == 'checkout')[0] + 1)

这将创建一个拆分数据帧的数组orders,您可以正常访问,如orders[0]orders[1]等等。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何根据另一列的值对列进行熊猫分组并获得每组的特定结果?

来自分类Dev

如何对行进行分组,在一列中计数,在另一列中求和?

来自分类Dev

根据一列的相同值进行分组和排序,然后对这些组中的另一列进行排序

来自分类Dev

根据一列进行分组,并在另一列中获取总和值

来自分类Dev

如何使用PLSQL根据一列中的重复值和另一列中的连续值进行过滤?

来自分类Dev

根据列值的条件对选定的行进行分组,然后转换另一列

来自分类Dev

如何根据熊猫中另一列的下限值对一列中的值求和?

来自分类Dev

如何让 Google 表格根据其中一列中的值自动对行进行排序?

来自分类Dev

根据另一列中的一列查找行值并进行计算

来自分类Dev

熊猫:根据另一列中的值按名称对多个列进行子集

来自分类Dev

根据熊猫中的另一列对唯一值进行排序

来自分类Dev

根据熊猫中的多个条件对行进行分组和过滤

来自分类Dev

如何根据另一列的特定值从一列中删除NaN

来自分类Dev

如何根据另一列中的间隔填充熊猫中其他列的缺失值?

来自分类Dev

如何为另一列中的特定值选择熊猫列中的值计数?

来自分类Dev

如何根据另一列中的值进行条件替换列中的值?

来自分类Dev

熊猫:根据另一列中的值计算每一行的jaccard相似度

来自分类Dev

根据每次出现的另一列特定值在熊猫中添加索引

来自分类Dev

如何根据连续的行值对熊猫中的元素进行分组

来自分类Dev

根据另一列对列中的值进行过滤和替换

来自分类Dev

根据列的值和另一列中列表的长度对数据框进行排序

来自分类Dev

如何在一列中获取具有最小值的行,并按另一列进行分组,同时保留其他列?

来自分类Dev

如何根据t-sql中的条件对一列的值进行分组?

来自分类Dev

如何根据另一列中的值填充另一列中的值?

来自分类Dev

在熊猫中,如何从一列中的唯一值中创建列,然后根据另一列中的值填充它?

来自分类Dev

从分组行中的同一列获取特定值

来自分类Dev

熊猫:通过将一列的值与另一行中同一列的另一个值进行比较来过滤行

来自分类Dev

如何在R的另一列中仅对具有多个不同值的行进行子集化?

来自分类Dev

如何在使用分组依据时对一列中的行进行计数

Related 相关文章

  1. 1

    如何根据另一列的值对列进行熊猫分组并获得每组的特定结果?

  2. 2

    如何对行进行分组,在一列中计数,在另一列中求和?

  3. 3

    根据一列的相同值进行分组和排序,然后对这些组中的另一列进行排序

  4. 4

    根据一列进行分组,并在另一列中获取总和值

  5. 5

    如何使用PLSQL根据一列中的重复值和另一列中的连续值进行过滤?

  6. 6

    根据列值的条件对选定的行进行分组,然后转换另一列

  7. 7

    如何根据熊猫中另一列的下限值对一列中的值求和?

  8. 8

    如何让 Google 表格根据其中一列中的值自动对行进行排序?

  9. 9

    根据另一列中的一列查找行值并进行计算

  10. 10

    熊猫:根据另一列中的值按名称对多个列进行子集

  11. 11

    根据熊猫中的另一列对唯一值进行排序

  12. 12

    根据熊猫中的多个条件对行进行分组和过滤

  13. 13

    如何根据另一列的特定值从一列中删除NaN

  14. 14

    如何根据另一列中的间隔填充熊猫中其他列的缺失值?

  15. 15

    如何为另一列中的特定值选择熊猫列中的值计数?

  16. 16

    如何根据另一列中的值进行条件替换列中的值?

  17. 17

    熊猫:根据另一列中的值计算每一行的jaccard相似度

  18. 18

    根据每次出现的另一列特定值在熊猫中添加索引

  19. 19

    如何根据连续的行值对熊猫中的元素进行分组

  20. 20

    根据另一列对列中的值进行过滤和替换

  21. 21

    根据列的值和另一列中列表的长度对数据框进行排序

  22. 22

    如何在一列中获取具有最小值的行,并按另一列进行分组,同时保留其他列?

  23. 23

    如何根据t-sql中的条件对一列的值进行分组?

  24. 24

    如何根据另一列中的值填充另一列中的值?

  25. 25

    在熊猫中,如何从一列中的唯一值中创建列,然后根据另一列中的值填充它?

  26. 26

    从分组行中的同一列获取特定值

  27. 27

    熊猫:通过将一列的值与另一行中同一列的另一个值进行比较来过滤行

  28. 28

    如何在R的另一列中仅对具有多个不同值的行进行子集化?

  29. 29

    如何在使用分组依据时对一列中的行进行计数

热门标签

归档