使用grep从字典中删除词根已存在的词

William Everett 发表于 Dev

威廉·埃弗里特

我正在尝试编写一个随机密码生成器。我有一本包含一堆单词的字典，我想删除其根已经在字典中的单词，这样一个字典看起来像：

ablaze
able
abler
ablest
abloom
ably

最终只会

ablaze
able
abloom
ably

因为能力和能力包含以前使用过的能力。

我希望使用grep进行此操作，以便我可以了解更多有关其工作原理的信息。我能够用c或python编写程序来执行此操作。

三元组

如果对列表进行了排序，以便较短的字符串始终在较长的字符串之前，则可以通过简单的Awk脚本获得相当好的性能。

awk '$1~r && p in k { next } { k[$1]++; print; r= "^" $1; p=$1 }' words

如果当前单词与前缀正则表达式r（稍后定义）匹配并且前缀p（同上）在可见键列表中，请跳过。否则，将当前单词添加到前缀键中，打印当前行，创建一个与行首匹配当前单词的正则表达式（现在是前缀regex r），并且还要记住前缀字符串p。

如果所有的类似的字符串始终是相邻的（因为它们是，如果你排序文件词汇），你可以废除k和p全太，我猜。

awk 'NR>1 && $1~r { next } { print; r="^" $1 }' words

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-6

我来说两句

0条评论

登录后参与评论

来自分类Dev

使用grep从已经存在词根的字典中删除单词

来自分类Dev

R：使用grep和tm包的部分匹配字典词

来自分类Dev

R：使用grep和tm包的部分匹配字典词

来自分类Dev

从页面中删除图像（如果已存在）

来自分类Dev

使用Ruby在源文本中查找字典词

来自分类Dev

使用中的已删除文件

来自分类Dev

删除Python中可能存在或不存在的字典属性

来自分类Dev

删除Python中可能存在或不存在的字典属性

来自分类Dev

Gerrit仓库中Gerrit中已删除的分支仍然存在

来自分类Dev

使用SQL查询查找已删除，已添加和已存在的故障单数量

来自分类Dev

删除字典值（如果它们存在于集合中）

来自分类Dev

删除对象肯定保存在字典中但保留密钥

来自分类Dev

如何将现有字典作为嵌套字典添加到python中已存在的字典中？

来自分类Dev

使用jQuery删除匹配词

来自分类Dev

检查字典中是否存在某项并将其从C＃中的字典中删除

来自分类Dev

使用for循环从字典中删除项目

来自分类Dev

如何从使用元组的字典中删除元素

来自分类Dev

无法使用del方法从字典列表中删除字典

来自分类Dev

使用grep从文件中删除注释

来自分类Dev

使用grep从文件中删除几行

来自分类Dev

如何在词云中取消对“ Jesu”的词根转换为“ Jesus”？

来自分类Dev

从字典字典中删除空字典

来自分类Dev

如果条目已存在，则将项目添加到字典列表中

来自分类Dev

一种“ pythonic”策略，用于检查字典中是否已存在键

来自分类Dev

要检查数组中是否已存在某个元素，然后检查是否存在，请将其删除

来自分类Dev

删除R中列表中的空词

来自分类Dev

使用rsync删除源中存在的文件

来自分类Dev

hg grep不检查已删除的文件

来自分类Dev

从字典中删除NoneTypes

Related 相关文章

文章