如何将两列和单词分组,以计算熊猫(或python)中的最后一列

用户名

1)例如,我有3列,如下所示

 date      categories     contents  
 2018-01   fish_tank1     Goldfish Gombessa Goosefish Gopher rockfish   
 2018-01   fish_tank2     Grass carp Goosefish Grayling mullet shark  
 2018-02   fish_tank2     Goosefish Gopher rockfish Grayling mullet shark  
 2018-01   fish_tank1     carp Goosefish Grayling Goldfish Gombessa   
 2018-02   fish_tank2     carp Goosefish Grayling Grass carp Goosefish  
 2018-03   fish_tank3     Grass carp Goosefish Grayling mullet shark  
 2018-03   fish_tank2     Goosefish Gopher rockfish Goosefish Grayling  

2)我想做df.groupby(['date','categories']).agg(df.contents.str.split(expand=True).stack().value_counts()得到类似下面的结果。但最近几天我无法弄清楚。

    date   categories       contents  
 2018-01   fish_tank1  2    Goldfish    2   
                            Gombessa    2   
                            Goosefish   2    
                            Gopher      1   
                            rockfish    1   
                            ......   
           fish_tank2      Grass    1   
                           carp     1   
                           .....  
 2018-02   fish_tank2     Goosefish    3  
                          Grayling     2  
                          Gopher       1  
                          ........    
........................  

3)谁能给我洞察力以获得想要的结果?

Vivek Kalyanarangan

采用 -

from collections import Counter
df['contents2'] = df['contents'].str.split()
df.groupby(['date', 'categories'])['contents2'].apply(lambda x: Counter(x.sum()))

输出量

date     categories           
2018-01  fish_tank1  Goldfish     2.0
                     Gombessa     2.0
                     Goosefish    2.0
                     Gopher       1.0
                     Grayling     1.0
                     carp         1.0
                     rockfish     1.0
         fish_tank2  Goosefish    1.0
                     Grass        1.0
                     Grayling     1.0
                     carp         1.0
                     mullet       1.0
                     shark        1.0
2018-02  fish_tank2  Goosefish    3.0
                     Gopher       1.0
                     Grass        1.0
                     Grayling     2.0
                     carp         2.0
                     mullet       1.0
                     rockfish     1.0
                     shark        1.0
2018-03  fish_tank2  Goosefish    2.0
                     Gopher       1.0
                     Grayling     1.0
                     rockfish     1.0
         fish_tank3  Goosefish    1.0
                     Grass        1.0
                     Grayling     1.0
                     carp         1.0
                     mullet       1.0
                     shark        1.0
Name: contents2, dtype: float64

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在熊猫中,如何将函数应用于返回两列的每一列

来自分类Dev

将熊猫数据框列中的单词按另一列分组以获得频率/计数

来自分类Dev

如何使用python检索大熊猫分组依据的最后一列行的值?

来自分类Dev

如何计算在熊猫中另一列上分组的平均值

来自分类Dev

如何将多列转换为JSON并按Python中的另一列进行分组

来自分类Dev

如何根据行中的特定值和熊猫中的另一列对行进行分组?

来自分类Dev

如何将字典中的一列转换为熊猫中的单独列?

来自分类Dev

如何将两个数据帧中的两列合并到新数据帧(熊猫)的一列中?

来自分类Dev

如何将两列合并为一列?

来自分类Dev

熊猫:如何将行中的一列转换为列

来自分类Dev

如何将多列乘以熊猫中的一列

来自分类Dev

如何将csv文件中的最后一列交换为第一列?+ awk

来自分类Dev

您如何计算一列中单词的出现频率?

来自分类Dev

按一列分组,但将另外两列相加并计算第三列

来自分类Dev

Python中基于pct_change的一列分组和反向计算

来自分类Dev

如何将第一列切换到最后一列

来自分类Dev

如何将一列的值求和并按另一列分组

来自分类Dev

如何删除熊猫数据框列中与另一列中的单词匹配的单词

来自分类Dev

Python:如何在两列之间的熊猫数据框中添加一列?

来自分类Dev

如何按一列分组,并在单独的列(熊猫)中计算值

来自分类Dev

如何将两列合并为一列(使用 Python)?

来自分类Dev

如何将数据框中的每一列拆分为两列?

来自分类Dev

如何将源节点中的两列合并为目标中的一列

来自分类Dev

如何将数据Gridview乘以两列并在另一列中显示结果

来自分类Dev

如何将一列拆分为两列并在Mysql Server中更新

来自分类Dev

将最后两个单词移到同一列的最前面

来自分类Dev

如何将两个表中的值包含在同一列中

来自分类Dev

如何将R中的两列按if语句分组?

来自分类Dev

如何将R中的函数应用于由另一列分组的数据帧的某些列?

Related 相关文章

  1. 1

    在熊猫中,如何将函数应用于返回两列的每一列

  2. 2

    将熊猫数据框列中的单词按另一列分组以获得频率/计数

  3. 3

    如何使用python检索大熊猫分组依据的最后一列行的值?

  4. 4

    如何计算在熊猫中另一列上分组的平均值

  5. 5

    如何将多列转换为JSON并按Python中的另一列进行分组

  6. 6

    如何根据行中的特定值和熊猫中的另一列对行进行分组?

  7. 7

    如何将字典中的一列转换为熊猫中的单独列?

  8. 8

    如何将两个数据帧中的两列合并到新数据帧(熊猫)的一列中?

  9. 9

    如何将两列合并为一列?

  10. 10

    熊猫:如何将行中的一列转换为列

  11. 11

    如何将多列乘以熊猫中的一列

  12. 12

    如何将csv文件中的最后一列交换为第一列?+ awk

  13. 13

    您如何计算一列中单词的出现频率?

  14. 14

    按一列分组,但将另外两列相加并计算第三列

  15. 15

    Python中基于pct_change的一列分组和反向计算

  16. 16

    如何将第一列切换到最后一列

  17. 17

    如何将一列的值求和并按另一列分组

  18. 18

    如何删除熊猫数据框列中与另一列中的单词匹配的单词

  19. 19

    Python:如何在两列之间的熊猫数据框中添加一列?

  20. 20

    如何按一列分组,并在单独的列(熊猫)中计算值

  21. 21

    如何将两列合并为一列(使用 Python)?

  22. 22

    如何将数据框中的每一列拆分为两列?

  23. 23

    如何将源节点中的两列合并为目标中的一列

  24. 24

    如何将数据Gridview乘以两列并在另一列中显示结果

  25. 25

    如何将一列拆分为两列并在Mysql Server中更新

  26. 26

    将最后两个单词移到同一列的最前面

  27. 27

    如何将两个表中的值包含在同一列中

  28. 28

    如何将R中的两列按if语句分组?

  29. 29

    如何将R中的函数应用于由另一列分组的数据帧的某些列?

热门标签

归档