我有一个大的文本文件集合。
我正在寻找一种方法来查找集合中同一行(在同一文件中)的两个字符串,其中这两个字符串之间的字符距离不大于我指定的距离。
例如,如果文本文件包含:
The quick brown fox jumps over the lazy dog
并且我传递了字符串fox
,over
并且距离为7(或更大)时,它将返回此行,因为这些单词之间的距离为7。
我正在运行Windows 8计算机。
使用egrep。或grep -e选项。
egrep -o "fox.{1,7}over" filename.txt
通常是:
egrep -o "string1.{1,7}string2" filename.txt
以上所有选项将仅返回匹配的部分。对于要返回的完整行,请不要使用-o选项。因此它将是:
egrep "string1.{1,7}string2" filename.txt
要将其应用于文件夹中的所有文件,请使用:
egrep "string1.{1,7}string2" *
所有这些都假定至少有一个字符分隔。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句