在 Pandas 数据框中创建重复值索引

普拉迪普·图玛拉

假设我有一个 df

t status
1 ok
2 ok
3 ok
4 closed
5 closed
6 closed
7 bad input
8 bad input
9 closed
10 closed
11 ok
12 ok
13 closed
14 closed

我想确定何时“关闭”出现以及持续多长时间。

所以结果应该是

t status    index
1 ok          0
2 ok          0
3 ok          0
4 closed      1
5 closed      1
6 closed      1
7 bad input   0
8 bad input   0
9 closed      2
10 closed     2
11 ok         0
12 ok         0
13 closed     3
14 closed     3

我尝试了标准的“for 循环”方法,但对于大型数据框不可行。我正在考虑使用 numpy where 并重复的解决方案

np.where(tmp['status']=='Closed', 1, 0)

每次“关闭”重新出现时,我都坚持添加 1

贝尼

IIUC我们使用shift cumsum创造条件

df['New']=0
df.loc[df.status=='closed','New']=(df.status.eq('closed')&df.status.shift().ne('closed')).cumsum()
df
     t    status  New
0    1        ok    0
1    2        ok    0
2    3        ok    0
3    4    closed    1
4    5    closed    1
5    6    closed    1
6    7  badinput    0
7    8  badinput    0
8    9    closed    2
9   10    closed    2
10  11        ok    0
11  12        ok    0
12  13    closed    3
13  14    closed    3

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用重复的索引值旋转pandas数据框

来自分类Dev

从一个与重复索引匹配的 Pandas 数据框列中返回值

来自分类Dev

在Pandas的MultiIndex数据框中修改重复的子索引

来自分类Dev

在Pandas的MultiIndex数据框中修改重复的子索引

来自分类Dev

从Pandas数据框中的列表中删除重复的值

来自分类Dev

正确的索引编制以在Pandas中创建新的数据框

来自分类Dev

如何在pandas数据框中创建列层次索引

来自分类Dev

替换在pandas数据框列中重复的值

来自分类Dev

根据行索引值从pandas数据框列中求和

来自分类Dev

在列相同的pandas数据框中查找索引值

来自分类Dev

重命名Pandas数据框中的索引值

来自分类Dev

在列相同的pandas数据框中查找索引值

来自分类Dev

根据行索引值从pandas数据框列中求和

来自分类Dev

在pandas数据框中基于相应列值重复列,并基于总计值重复行

来自分类Dev

根据数据框中的索引值将Pandas数据框拆分为多个Excel工作表

来自分类Dev

Pandas 中数据框列的索引

来自分类Dev

选择Pandas数据框索引,此后列中的数据都高于特定值

来自分类Dev

通过在 Pandas 数据框中的单独计数列聚合重复的源和目标值来创建新的数据框

来自分类Dev

遍历Pandas数据框中的行以查找其他文件中的值并提取索引

来自分类Dev

将索引值移动到pandas数据框中的列名称中

来自分类Dev

创建具有多列索引的Pandas数据框

来自分类Dev

Pandas 数据框 - 从单独的列创建日期时间索引

来自分类Dev

在Pandas数据框中创建父子对的字典

来自分类Dev

Pandas 从字典列表中创建数据框

来自分类Dev

通过不在列表中的索引值对Pandas数据框进行切片

来自分类Dev

如何对齐多个数据框的索引并在Pandas中填写相应的缺失值?

来自分类Dev

查找重复值的计数并在Pandas数据框中排序

来自分类Dev

Pandas 如何重塑包含列重复值的数据框

来自分类Dev

Pandas数据框基于索引和列值删除行

Related 相关文章

  1. 1

    使用重复的索引值旋转pandas数据框

  2. 2

    从一个与重复索引匹配的 Pandas 数据框列中返回值

  3. 3

    在Pandas的MultiIndex数据框中修改重复的子索引

  4. 4

    在Pandas的MultiIndex数据框中修改重复的子索引

  5. 5

    从Pandas数据框中的列表中删除重复的值

  6. 6

    正确的索引编制以在Pandas中创建新的数据框

  7. 7

    如何在pandas数据框中创建列层次索引

  8. 8

    替换在pandas数据框列中重复的值

  9. 9

    根据行索引值从pandas数据框列中求和

  10. 10

    在列相同的pandas数据框中查找索引值

  11. 11

    重命名Pandas数据框中的索引值

  12. 12

    在列相同的pandas数据框中查找索引值

  13. 13

    根据行索引值从pandas数据框列中求和

  14. 14

    在pandas数据框中基于相应列值重复列,并基于总计值重复行

  15. 15

    根据数据框中的索引值将Pandas数据框拆分为多个Excel工作表

  16. 16

    Pandas 中数据框列的索引

  17. 17

    选择Pandas数据框索引,此后列中的数据都高于特定值

  18. 18

    通过在 Pandas 数据框中的单独计数列聚合重复的源和目标值来创建新的数据框

  19. 19

    遍历Pandas数据框中的行以查找其他文件中的值并提取索引

  20. 20

    将索引值移动到pandas数据框中的列名称中

  21. 21

    创建具有多列索引的Pandas数据框

  22. 22

    Pandas 数据框 - 从单独的列创建日期时间索引

  23. 23

    在Pandas数据框中创建父子对的字典

  24. 24

    Pandas 从字典列表中创建数据框

  25. 25

    通过不在列表中的索引值对Pandas数据框进行切片

  26. 26

    如何对齐多个数据框的索引并在Pandas中填写相应的缺失值?

  27. 27

    查找重复值的计数并在Pandas数据框中排序

  28. 28

    Pandas 如何重塑包含列重复值的数据框

  29. 29

    Pandas数据框基于索引和列值删除行

热门标签

归档