Python在数据框架中搜索列表中的单词,并跟踪找到的单词和频率

冠状病毒

我引用了以下帖子,它对您很有帮助,但我需要进一步走下去。Python-从列表中搜索数据框内的字符串

我不仅要在数据框中搜索单词列表,还要跟踪是否找到了多个单词以及出现的频率。因此,使用以上文章中的示例:

如果这是我的搜索列表

search_list = ['STEEL','IRON','GOLD','SILVER']

这是我正在搜索的数据框

      a    b             
0    123   'Blah Blah Steel'
1    456   'Blah Blah Blah Steel Gold'
2    789   'Blah Blah Gold'
3    790   'Blah Blah blah'

我希望我的输出是

      a    b                        c               d
0    123   'Blah Blah Steel'      'STEEL'           1
1    789   'Blah Blah Steel Gold' 'STEEL','GOLD'    2
2    789   'Blah Blah Gold'       'GOLD'            1
3    790   'Blah Blah blah'

我如何扩展上述文章中的出色解决方案以获得所需的输出?我目前正在使用投票最高的答案作为起点。

我更关心能够从列表中标记多个单词。我还没有找到任何方法可以做到这一点。如果在此步骤中无法执行此操作,则可以将字符串计数功能应用于数据帧以创建频率列。如果有一种方法可以一步一步完成所有操作,那么也很高兴知道这一点。

提前致谢!

阿坎莎·阿特里

您可以使用re.findall()而不是extract()来完成所需的操作。

import re

search_list = ['STEEL','IRON','GOLD','SILVER']

df['c'] = df.b.str.findall('({0})'.format('|'.join(search_list)), flags=re.IGNORECASE)
df['d'] = df['c'].str.len()

此输出如下所示:

在此处输入图片说明

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在数据框的列中找到列表中的任何单词

来自分类Dev

计算单词列表中的单词频率

来自分类Dev

从列表中查找数据框中的单词出现频率

来自分类Dev

python搜索文件中的单词列表

来自分类Dev

在数据库中搜索单词数组

来自分类Dev

用数据框中的单词替换列表中的单词,Python

来自分类Dev

在单词列表中搜索字母?

来自分类Dev

搜索段落中的单词列表

来自分类Dev

计算字典列表中单词的出现频率

来自分类Dev

根据多个数据帧中的单词频率创建建议单词列表

来自分类Dev

在数据框字符串列中查找单词列表

来自分类Dev

文件中单词的频率

来自分类Dev

查找句子中单词的位置和频率

来自分类Dev

在Python 2.7中的Tkinter文本widgit中搜索单词列表

来自分类Dev

Python:计算txt文件中单词的频率

来自分类Dev

单词中字母的python位置频率字典

来自分类Dev

在列表中找到重复的单词,然后从列表中删除单词

来自分类Dev

我想按日期在pyspark数据框中找到MapType中单词的频率?

来自分类Dev

如何让python在列表中搜索一个单词而不是列表中所有单词的文本?

来自分类Dev

在列表python中搜索单词的其余部分

来自分类Dev

熊猫在数据框中的单词掉落

来自分类Dev

如何计算数据框列中列表中单词的频率?

来自分类Dev

在数据框中的一列中搜索特定单词

来自分类Dev

在文本中搜索单词列表的算法

来自分类Dev

utf-8 在列表中搜索单词

来自分类Dev

从python列表中删除单词?

来自分类Dev

在数据库中搜索具有不同书写或拼写的单词

来自分类Dev

使用php在xml数据中搜索单词

来自分类Dev

Python:在2d列表中找到一个单词,然后返回交集,即该单词在列表中的行索引和列索引

Related 相关文章

  1. 1

    在数据框的列中找到列表中的任何单词

  2. 2

    计算单词列表中的单词频率

  3. 3

    从列表中查找数据框中的单词出现频率

  4. 4

    python搜索文件中的单词列表

  5. 5

    在数据库中搜索单词数组

  6. 6

    用数据框中的单词替换列表中的单词,Python

  7. 7

    在单词列表中搜索字母?

  8. 8

    搜索段落中的单词列表

  9. 9

    计算字典列表中单词的出现频率

  10. 10

    根据多个数据帧中的单词频率创建建议单词列表

  11. 11

    在数据框字符串列中查找单词列表

  12. 12

    文件中单词的频率

  13. 13

    查找句子中单词的位置和频率

  14. 14

    在Python 2.7中的Tkinter文本widgit中搜索单词列表

  15. 15

    Python:计算txt文件中单词的频率

  16. 16

    单词中字母的python位置频率字典

  17. 17

    在列表中找到重复的单词,然后从列表中删除单词

  18. 18

    我想按日期在pyspark数据框中找到MapType中单词的频率?

  19. 19

    如何让python在列表中搜索一个单词而不是列表中所有单词的文本?

  20. 20

    在列表python中搜索单词的其余部分

  21. 21

    熊猫在数据框中的单词掉落

  22. 22

    如何计算数据框列中列表中单词的频率?

  23. 23

    在数据框中的一列中搜索特定单词

  24. 24

    在文本中搜索单词列表的算法

  25. 25

    utf-8 在列表中搜索单词

  26. 26

    从python列表中删除单词?

  27. 27

    在数据库中搜索具有不同书写或拼写的单词

  28. 28

    使用php在xml数据中搜索单词

  29. 29

    Python:在2d列表中找到一个单词,然后返回交集,即该单词在列表中的行索引和列索引

热门标签

归档