如何比较可变长度的未排序单词列表,并删除带有后缀的重复单词?
单词列表示例:
iron
curl
curled
railroad
curler
curling
curls
irons
pan
pans
park
parker
parks
parked
railroads
示例输出:
iron
curl
railroad
pan
park
所有单词的长度都不同,而不仅仅是四个或八个字母。我知道如何搜索和打印包含后缀的单词,但是我不确定如何比较包含后缀的单词列表,如果存在不带后缀的单词,请删除带有后缀的单词列表,而不更改排序顺序。
在另一个问题上为我创建的解决方案用户“ 123”能够可靠地去除后缀,而无需弄乱单词。我想回来回答这个问题,以便任何寻求类似解决方案的人都能得到很好的答案。
awk 'FNR==NR{a[$0 "s"]++;next}!($0 in a)' file.txt file.txt
awk 'FNR==NR{a[$0 "ed"]++;next}!($0 in a)' file.txt file.txt
awk 'FNR==NR{a[$0 "ing"]++;next}!($0 in a)' file.txt file.txt
awk 'FNR==NR{a[$0 "ness"]++;next}!($0 in a)' file.txt file.txt
awk 'FNR==NR{a[$0 "er"]++;next}!($0 in a)' file.txt file.txt
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句