如何计算熊猫数据框中的重复行?

jss367

我正在尝试计算数据框中每种类型的行的重复项。例如,假设我在熊猫中有一个数据框,如下所示:

df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
                   'two': pd.Series([1., 2., 1])})

我得到一个看起来像这样的df:

    one two
0   1   1
1   1   2
2   1   1

我想第一步是找到所有不同的唯一行,我这样做是:

df.drop_duplicates()

这给了我以下df:

    one two
0   1   1
1   1   2

现在,我想从上面的df([1 1]和[1 2])中获取每一行,并计算出初始df中每行的次数。我的结果看起来像这样:

Row     Count
[1 1]     2
[1 2]     1

我应该怎么做最后一步?

编辑:

这是一个更大的示例,它更加清楚:

df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
                   'two': pd.Series([True, False, False, True]),
                   'three': pd.Series([True, False, False, False])})

给我:

    one three   two
0   True    True    True
1   True    False   False
2   True    False   False
3   False   False   True

我想要一个告诉我的结果:

       Row           Count
[True True True]       1
[True False False]     2
[False False True]     1
埃德·楚姆

您可以groupby在所有列上调用size索引来指示重复的值:

In [28]:
df.groupby(df.columns.tolist(),as_index=False).size()

Out[28]:
one    three  two  
False  False  True     1
True   False  False    2
       True   True     1
dtype: int64

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何删除熊猫数据框中具有重复的行?

来自分类Dev

如何计算熊猫数据框中连续行之间的差异?

来自分类Dev

如何计算熊猫数据框中匹配的行组数?

来自分类Dev

熊猫数据框对重复的行执行计算

来自分类Dev

如何计算熊猫数据框中的值

来自分类Dev

计算熊猫数据框中的重复元素

来自分类Dev

计算数据框熊猫中的重复单词

来自分类Dev

Python:如何计算熊猫数据框中重复的夫妇值的数量?

来自分类Dev

如何重复熊猫数据框?

来自分类Dev

如何根据特定条件在熊猫中删除数据框中的重复行

来自分类Dev

如果值在列表中,则熊猫数据框中的行重复

来自分类Dev

抖动几乎重复了熊猫数据框中的行

来自分类Dev

熊猫数据框重复的行与类中的列表分隔?

来自分类Dev

在熊猫数据框中按行计算质心

来自分类Dev

如何在熊猫数据框中查找重复项

来自分类Dev

如何删除熊猫数据框中的重复标签?

来自分类Dev

熊猫:如何从DataFrame中删除重复的行并计算其频率?

来自分类Dev

如何计算熊猫中重新采样的多索引数据框

来自分类Dev

如何计算熊猫数据框中列值更改的频率?

来自分类Dev

如何使用熊猫计算数据框中的单词?

来自分类Dev

如何递增计算熊猫数据框中的每个不同值

来自分类Dev

如何计算熊猫数据框中列值更改的频率

来自分类Dev

如何在熊猫数据框中成对计算关联

来自分类Dev

如何计算熊猫中重新采样的多索引数据框

来自分类Dev

如何计算熊猫数据框中条件元素之间的变化

来自分类Dev

重复熊猫数据框行标签

来自分类Dev

重复特定行的熊猫数据框

来自分类Dev

如何计算数据框列中重复值的频率?

来自分类Dev

计算熊猫数据框中的路径数据

Related 相关文章

  1. 1

    如何删除熊猫数据框中具有重复的行?

  2. 2

    如何计算熊猫数据框中连续行之间的差异?

  3. 3

    如何计算熊猫数据框中匹配的行组数?

  4. 4

    熊猫数据框对重复的行执行计算

  5. 5

    如何计算熊猫数据框中的值

  6. 6

    计算熊猫数据框中的重复元素

  7. 7

    计算数据框熊猫中的重复单词

  8. 8

    Python:如何计算熊猫数据框中重复的夫妇值的数量?

  9. 9

    如何重复熊猫数据框?

  10. 10

    如何根据特定条件在熊猫中删除数据框中的重复行

  11. 11

    如果值在列表中,则熊猫数据框中的行重复

  12. 12

    抖动几乎重复了熊猫数据框中的行

  13. 13

    熊猫数据框重复的行与类中的列表分隔?

  14. 14

    在熊猫数据框中按行计算质心

  15. 15

    如何在熊猫数据框中查找重复项

  16. 16

    如何删除熊猫数据框中的重复标签?

  17. 17

    熊猫:如何从DataFrame中删除重复的行并计算其频率?

  18. 18

    如何计算熊猫中重新采样的多索引数据框

  19. 19

    如何计算熊猫数据框中列值更改的频率?

  20. 20

    如何使用熊猫计算数据框中的单词?

  21. 21

    如何递增计算熊猫数据框中的每个不同值

  22. 22

    如何计算熊猫数据框中列值更改的频率

  23. 23

    如何在熊猫数据框中成对计算关联

  24. 24

    如何计算熊猫中重新采样的多索引数据框

  25. 25

    如何计算熊猫数据框中条件元素之间的变化

  26. 26

    重复熊猫数据框行标签

  27. 27

    重复特定行的熊猫数据框

  28. 28

    如何计算数据框列中重复值的频率?

  29. 29

    计算熊猫数据框中的路径数据

热门标签

归档