我试图找到有关该主题的现有主题,但发现了一些东西,但这并不是我要找的100%,最近几天我的互联网连接很差,所以我需要退出搜索并发布新话题。 。
所以我的问题是我有一个.txt文件,其中有很多行(超过50000),每行有5个字母字符串,如下所示:
KKIUB
SDCVG
KJUTT
NGTHH
WWLEE
XGHTP
NJFRT
PPSFF
ZZZLP
XDRFX
JJJJJ
KIEYW
...
我希望删除包含两个(或更多)相同字母的文件中的所有行。复制的顺序并不重要,因此必须删除一行中两次包含字母的所有行。请注意,有时可以全部包含5个相同的字母,有时可以是3个相同的字母,有时只能是2个相同的字母+彼此不靠近,例如“ GOHIG”。
KKIUB ---> delete
SDCVG ---> stays
KJUTT ---> delete
NGTHH ---> delete
WWLEE ---> delete
XGHTP ---> stays
NJFRT ---> stays
PPSFF ---> delete
ZZZLP ---> delete
XDRFX ---> delete
JJJJJ ---> delete
KIEYW ---> stays
我正在尝试使用sed
功能,但无法获得良好的结果。另外,我想将其导出到另一个.txt文件中。有什么帮助吗?
sed -e '/\(.\).*\1/d' yourfile > youroutputfile
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句