计算多列中每个唯一行的字符串出现次数

埃姆

我想计算多列中某些字符串的出现并在新列中返回总计数

所以我知道我可以使用value_counts来计算给定列中值的总出现次数:

data['col'].value_counts(dropna=False)

结果:

[["win" TKO technical knockout]     336
[["win" UD unanimous decision]      307
[["win" KO knockout]                225
[["loss" UD unanimous decision]      97
[["loss" TKO technical knockout]     64
[["win" nan null]                    53
[["draw" MD majority decision]       43
[["loss" KO knockout]                41
[["loss" MD majority decision]       35
[["loss" nan null]                   32
[["loss" SD split decision]          29
[["unknown" nan null]                29
[["win" SD split decision]           27
[["draw" PTS null]                   18
[["win" RTD corner retirement]       17
[["draw" SD split decision]          12
[["loss" RTD corner retirement]      11
[["win" MD majority decision]         9
[["loss" DQ disqualification]         6
[["win" PTS null]                     6
[["unknown" NC null]                  3

问题是我想例如计算每个相关列中的[[“ win” KO淘汰赛]的出现(相关列是col1到col20)。

这是我的数据样本:

{'col1': {0: ['["win" UD unanimous decision'],
  1: ['["win" UD unanimous decision'],
  2: ['["win" TKO technical knockout'],
  3: ['["win" UD unanimous decision'],
  4: ['["win" UD unanimous decision']},
 'col2': {0: ['["win" TKO technical knockout'],
  1: ['["win" TKO technical knockout'],
  2: ['["win" TKO technical knockout'],
  3: ['["win" UD unanimous decision'],
  4: ['["win" UD unanimous decision']},
 'col3': {0: ['["win" TKO technical knockout'],
  1: ['["win" KO knockout'],
  2: ['["win" TKO technical knockout'],
  3: ['["win" TKO technical knockout'],
  4: ['["win" UD unanimous decision']},
 'col4': {0: ['["win" UD unanimous decision'],
  1: ['["win" UD unanimous decision'],
  2: ['["win" KO knockout'],
  3: ['["win" TKO technical knockout'],
  4: ['["win" UD unanimous decision']}}

在这种情况下,所需的输出为:

      win UD   win TKO   win KO 
0       2         2         0
1       2         1         1
2       0         3         1
3       2         2         0
4       4         0         0

更新:

我也尝试过使用size和groupby:

#list of column names
col_outcome = ['col'+str(i) for i in range(1,11)]
data.groupby(col_outcome).size()

但是,这将返回以下错误消息:

TypeError:无法散列的类型:“列表”

斯科特·波士顿

IIUC,让我们重塑“广”数据帧,以“长”有stack则做一个小小的数据串清理,然后extractreplace使用正则表达式,下一个groupbyapply value_count,最后使用unstack重塑的结果:

df.stack().str[0].str.replace('\[|\"','')\
  .str.extract('(\w+\s\w+)')\
  .groupby(level=0)[0].apply(pd.Series.value_counts).unstack(fill_value=0)

输出:

   win KO  win TKO  win UD
0       0        2       2
1       1        1       2
2       1        3       0
3       0        2       2
4       0        0       4

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

计算每个选定列中字符串出现的次数

来自分类Dev

我想计算一行中字符串出现的次数(特定于3列:B,J,K)。

来自分类Dev

计算一列中每个字符串的出现次数

来自分类Dev

计算范围内每个唯一字符串的出现次数

来自分类Dev

在 Python 3 中计算字符串中唯一字母的出现次数

来自分类Dev

Pyspark如何计算每个组中字符串的出现次数并打印多个选定的列?

来自分类Dev

计算csv文件列中字符串的出现次数

来自分类Dev

如何计算R中列的每个字符串的第一个字符的出现次数

来自分类Dev

在“多文件”中搜索“多字符串”并打印“一行中每个文件的结果”

来自分类Dev

计算字符串中字符串出现的次数

来自分类Dev

计算一个字符串在另一个字符串中每个字符的出现次数

来自分类Dev

计算字符串中每个字符的出现次数

来自分类Dev

计算所有出现在一行中的多组字符串

来自分类Dev

使用C#中的字典计算字符串中每个重复单词的出现次数

来自分类Dev

计算字符串中每个单词的出现次数并将其放入对象中

来自分类Dev

使用条件计算另一列中一列中字符串的出现次数

来自分类Dev

计算每个值出现在一行数据帧 r 中的次数

来自分类Dev

计算linux中每个字符串之前的特定数字的出现次数

来自分类Dev

文件中唯一行的出现次数

来自分类Dev

如何计算字符串中字符出现的次数?

来自分类Dev

如何计算字符串中字符的出现次数

来自分类Dev

计算熊猫中字符串中单词的出现次数

来自分类Dev

计算数据框中每一行和特定列在列表中的出现次数

来自分类Dev

计算oracle表中每一行的出现次数

来自分类Dev

计算R中多个列中字符串先前的出现次数

来自分类Dev

计算字符串中数字出现的次数

来自分类Dev

Python:计算字符串中列表项的出现次数

来自分类Dev

Bash脚本计算文件中字符串出现的次数

来自分类Dev

计算字符串Python中的出现次数

Related 相关文章

  1. 1

    计算每个选定列中字符串出现的次数

  2. 2

    我想计算一行中字符串出现的次数(特定于3列:B,J,K)。

  3. 3

    计算一列中每个字符串的出现次数

  4. 4

    计算范围内每个唯一字符串的出现次数

  5. 5

    在 Python 3 中计算字符串中唯一字母的出现次数

  6. 6

    Pyspark如何计算每个组中字符串的出现次数并打印多个选定的列?

  7. 7

    计算csv文件列中字符串的出现次数

  8. 8

    如何计算R中列的每个字符串的第一个字符的出现次数

  9. 9

    在“多文件”中搜索“多字符串”并打印“一行中每个文件的结果”

  10. 10

    计算字符串中字符串出现的次数

  11. 11

    计算一个字符串在另一个字符串中每个字符的出现次数

  12. 12

    计算字符串中每个字符的出现次数

  13. 13

    计算所有出现在一行中的多组字符串

  14. 14

    使用C#中的字典计算字符串中每个重复单词的出现次数

  15. 15

    计算字符串中每个单词的出现次数并将其放入对象中

  16. 16

    使用条件计算另一列中一列中字符串的出现次数

  17. 17

    计算每个值出现在一行数据帧 r 中的次数

  18. 18

    计算linux中每个字符串之前的特定数字的出现次数

  19. 19

    文件中唯一行的出现次数

  20. 20

    如何计算字符串中字符出现的次数?

  21. 21

    如何计算字符串中字符的出现次数

  22. 22

    计算熊猫中字符串中单词的出现次数

  23. 23

    计算数据框中每一行和特定列在列表中的出现次数

  24. 24

    计算oracle表中每一行的出现次数

  25. 25

    计算R中多个列中字符串先前的出现次数

  26. 26

    计算字符串中数字出现的次数

  27. 27

    Python:计算字符串中列表项的出现次数

  28. 28

    Bash脚本计算文件中字符串出现的次数

  29. 29

    计算字符串Python中的出现次数

热门标签

归档