在bash中,如何计算一组中每个单词在多个文件中的出现

半生

我有一个很大的单词列表(> 1000),它们实际上是文件名,并且包含很多源代码文件(> 2000)。我想为列表中的每个单词(文件名)计算其在目录的所有文件中的总出现次数。我目前正在做的是:

#!/bin/sh
SEARCHPATH=$1
for var in "${@:2}"
do
    BASE=$( basename "$var" )
    COUNT=$(grep -o "$BASE" $SEARCHPATH/* | wc -l)
    echo -e "$BASE:" " $COUNT"
done

这种方法有效,但效率低下,因为对于每个单词,它都会搜索整个目录,并且单词太多。我正在寻找一种扫描目录一次,累积字数的解决方案。

狗b

将您所有的单词都放在一个文件中。然后,您可以尝试以下操作:

grep -ohFf wordsFile path/* | sort | uniq -c

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类常见问题

如何计算一组单词在t-sql中的给定数据中出现的次数?

来自分类Dev

如何计算一组单词在t-sql中的给定数据中出现的次数?

来自分类Dev

如何从Unix或Linux的一组文件中的哪个文件中查找单词集中的任何单词?

来自分类Dev

一组字符串中每个单词的频率

来自分类Dev

在一组 pdf 文件中查找单词或一组单词

来自分类Dev

在 bash 中,我想根据一组单词为每个单词生成一组固定的 4 个字符输出并始终匹配

来自分类Dev

计算唯一组组合中的出现次数

来自分类Dev

计算一组条件在时间序列中的出现次数

来自分类Dev

如何从一组单词中获取特定字母出现的次数

来自分类Dev

如何计算目录中所有文件中单词的出现次数?但是每个文件每个单词的计数仅增加一次

来自分类Dev

如何从字符串中抓取一组单词?

来自分类Dev

如何从字符串中获取一组单词?

来自分类Dev

Xquery:计算一组记录中每个记录中一个术语出现的次数

来自分类Dev

Pyspark如何计算每个组中字符串的出现次数并打印多个选定的列?

来自分类Dev

如何从Racket中的文件中读取一组数据?

来自分类Dev

计算一组中的点数 - Highcharts

来自分类Dev

如何用C中的一组目标文件编译一组C文件

来自分类Dev

Java程序-计算文本文件中的所有单词,并计算每个单词的出现频率

来自分类Dev

如何计算在作为参数传递的所有“ n”个文件中,文件中每个单词的出现次数?

来自分类Dev

如何为同一文件路径中的每个文件分别执行同一组命令?

来自分类Dev

在同一个文件中或在一组文件的每个文件中具有多个类的速度更快?

来自分类Dev

我如何从python中的一组单词中寻找最短的唯一子序列?

来自分类Dev

如何在XSLT 1.0中引用一组文件?

来自分类Dev

如何在Ubuntu中重命名一组文件

来自分类Dev

如何从文件中删除一组行?

来自分类Dev

如何删除目录中的一组特定的.png文件?

来自分类Dev

如何加载存储在 zip 文件中的一组图像?

来自分类Dev

如何计算存储在数组列表中的每个句子中每个单词的出现次数?

来自分类Dev

打印文件中每个单词的出现次数

Related 相关文章

  1. 1

    如何计算一组单词在t-sql中的给定数据中出现的次数?

  2. 2

    如何计算一组单词在t-sql中的给定数据中出现的次数?

  3. 3

    如何从Unix或Linux的一组文件中的哪个文件中查找单词集中的任何单词?

  4. 4

    一组字符串中每个单词的频率

  5. 5

    在一组 pdf 文件中查找单词或一组单词

  6. 6

    在 bash 中,我想根据一组单词为每个单词生成一组固定的 4 个字符输出并始终匹配

  7. 7

    计算唯一组组合中的出现次数

  8. 8

    计算一组条件在时间序列中的出现次数

  9. 9

    如何从一组单词中获取特定字母出现的次数

  10. 10

    如何计算目录中所有文件中单词的出现次数?但是每个文件每个单词的计数仅增加一次

  11. 11

    如何从字符串中抓取一组单词?

  12. 12

    如何从字符串中获取一组单词?

  13. 13

    Xquery:计算一组记录中每个记录中一个术语出现的次数

  14. 14

    Pyspark如何计算每个组中字符串的出现次数并打印多个选定的列?

  15. 15

    如何从Racket中的文件中读取一组数据?

  16. 16

    计算一组中的点数 - Highcharts

  17. 17

    如何用C中的一组目标文件编译一组C文件

  18. 18

    Java程序-计算文本文件中的所有单词,并计算每个单词的出现频率

  19. 19

    如何计算在作为参数传递的所有“ n”个文件中,文件中每个单词的出现次数?

  20. 20

    如何为同一文件路径中的每个文件分别执行同一组命令?

  21. 21

    在同一个文件中或在一组文件的每个文件中具有多个类的速度更快?

  22. 22

    我如何从python中的一组单词中寻找最短的唯一子序列?

  23. 23

    如何在XSLT 1.0中引用一组文件?

  24. 24

    如何在Ubuntu中重命名一组文件

  25. 25

    如何从文件中删除一组行?

  26. 26

    如何删除目录中的一组特定的.png文件?

  27. 27

    如何加载存储在 zip 文件中的一组图像?

  28. 28

    如何计算存储在数组列表中的每个句子中每个单词的出现次数?

  29. 29

    打印文件中每个单词的出现次数

热门标签

归档