基于列内部索引对大熊猫数据框进行分组

绿色

我有一个熊猫数据框,当每一行都是一个单词时,它代表一个句子列表,并且它的ID对应于它在句子中的位置。
看起来像:

       ID        FORM 
  0    1           A   
  1    2        word   
  2    3          in   
  3    4         the   
  4    5       first   
  5    6    sentence   
  6    7           .   
  7    1         The   
  8    2      second   
  9    3    sentence   
  10   4           .   
  11   1         the   
  12   2       third   
  13   3    sentence     
        ...

如何添加一个名为“句子”的额外列,该列将与给定单词所属的句子相对应,并且我的数据框架如下所示:

        ID        FORM  Sentence  
  0    1           A    1
  1    2        word    1
  2    3          in    1
  3    4         the    1
  4    5       first    1
  5    6    sentence    1
  6    7           .    1
  7    1         The    2
  8    2      second    2
  9    3    sentence    2
  10   4           .    2
  11   1         the    3
  12   2       third    3
  13   3    sentence    3

我可以通过迭代数据框并手动创建一个序列来完成此操作,但是它看起来很丑陋,而且不那么张扬。有没有一种好的方法可以使用熊猫为我做?

皮特巴格

尝试这个

df['Sentence']=(df['ID'].diff()<0).cumsum()
df

产生

     ID  FORM        Sentence
--  ----  --------  ----------
 0     1  A                  0
 1     2  word               0
 2     3  in                 0
 3     4  the                0
 4     5  first              0
 5     6  sentence           0
 6     7  .                  0
 7     1  The                1
 8     2  second             1
 9     3  sentence           1
10     4  .                  1
11     1  the                2
12     2  third              2
13     3  sentence           2

(df['ID'].diff()<0)是一个布尔数组,当ID减少时为True .cumsum()每次发生这种情况时加1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

筛选多索引分组大熊猫数据框

来自分类Dev

大熊猫:连接数据框,对列数据进行正向填充和多索引

来自分类Dev

大熊猫:基于多个列对数据框进行排序

来自分类Dev

在大熊猫中有效地对数据框进行分组?

来自分类Dev

大熊猫数据框的索引当前是两列的“分组依据”,但是我希望它们作为具有标准数字索引的自己的列

来自分类Dev

按索引对大熊猫数据框进行排序,然后按字母顺序排序

来自分类Dev

按索引对大熊猫数据框进行排序,然后按字母顺序排序

来自分类Dev

大熊猫数据帧如何分组(枢轴?)通过指定的列的值的行,但保持原始索引?

来自分类Dev

大熊猫数据框中的布尔索引

来自分类Dev

大熊猫:从基于多个列的数据框中删除观察结果

来自分类Dev

大熊猫:从基于多个列的数据框中删除观察结果

来自分类Dev

查找大熊猫数据框的列发生变化的索引

来自分类Dev

如何对大熊猫数据框进行非词汇排序?

来自分类Dev

使用多列在大熊猫中转换大熊猫数据框

来自分类Dev

大熊猫,如何按列值过滤数据框

来自分类Dev

如何自动命名大熊猫数据框列?

来自分类Dev

替换大熊猫数据框中的列值

来自分类Dev

大熊猫数据框中仅某些列的总和

来自分类Dev

基于列条件的大熊猫

来自分类常见问题

分割大熊猫数据框

来自分类Dev

计算大熊猫数据框的元组

来自分类Dev

大熊猫数据框并行处理

来自分类Dev

在大熊猫中将多索引数据框解压缩为平面数据框

来自分类Dev

在大熊猫中将多索引数据框解压缩为平面数据框

来自分类Dev

大熊猫:删除另一个数据框中的行,对列的子集进行比较

来自分类Dev

选择大熊猫分组依据数据框的子集,其中多个键具有值

来自分类Dev

删除数据框中所有以大熊猫分组重复的值

来自分类Dev

大熊猫:根据其他多层列,对最里面的列进行分组排序

来自分类Dev

如何基于索引列执行大熊猫drop_duplicates

Related 相关文章

  1. 1

    筛选多索引分组大熊猫数据框

  2. 2

    大熊猫:连接数据框,对列数据进行正向填充和多索引

  3. 3

    大熊猫:基于多个列对数据框进行排序

  4. 4

    在大熊猫中有效地对数据框进行分组?

  5. 5

    大熊猫数据框的索引当前是两列的“分组依据”,但是我希望它们作为具有标准数字索引的自己的列

  6. 6

    按索引对大熊猫数据框进行排序,然后按字母顺序排序

  7. 7

    按索引对大熊猫数据框进行排序,然后按字母顺序排序

  8. 8

    大熊猫数据帧如何分组(枢轴?)通过指定的列的值的行,但保持原始索引?

  9. 9

    大熊猫数据框中的布尔索引

  10. 10

    大熊猫:从基于多个列的数据框中删除观察结果

  11. 11

    大熊猫:从基于多个列的数据框中删除观察结果

  12. 12

    查找大熊猫数据框的列发生变化的索引

  13. 13

    如何对大熊猫数据框进行非词汇排序?

  14. 14

    使用多列在大熊猫中转换大熊猫数据框

  15. 15

    大熊猫,如何按列值过滤数据框

  16. 16

    如何自动命名大熊猫数据框列?

  17. 17

    替换大熊猫数据框中的列值

  18. 18

    大熊猫数据框中仅某些列的总和

  19. 19

    基于列条件的大熊猫

  20. 20

    分割大熊猫数据框

  21. 21

    计算大熊猫数据框的元组

  22. 22

    大熊猫数据框并行处理

  23. 23

    在大熊猫中将多索引数据框解压缩为平面数据框

  24. 24

    在大熊猫中将多索引数据框解压缩为平面数据框

  25. 25

    大熊猫:删除另一个数据框中的行,对列的子集进行比较

  26. 26

    选择大熊猫分组依据数据框的子集,其中多个键具有值

  27. 27

    删除数据框中所有以大熊猫分组重复的值

  28. 28

    大熊猫:根据其他多层列,对最里面的列进行分组排序

  29. 29

    如何基于索引列执行大熊猫drop_duplicates

热门标签

归档