如何从文本文件中删除唯一的字符串？

debugcn 发表于 Dev

杰瑞

对不起，我不得不编辑我的示例，因为我没有正确表达我的查询。假设我有.txt文件：

Happy sad
Happy sad
Happy sad
Sad happy
Happy sad
Happy sad
Mad sad
Mad happy
Mad happy

我想删除任何唯一的字符串。将文件保留为：

Happy sad
Happy sad
Happy sad
Happy sad
Happy sad
Mad happy
Mad happy

我知道排序可以消除重复项（sort file.txt | uniq），所以无论如何，我们可以使用命令在bash中执行相反的操作吗？还是我只需要找出一个while循环？BTWuniq -D file.txt > output.txt不起作用。

库萨兰达

使用awk：

$ awk 'seen[$0]++; seen[$0] == 2' file
Happy sad
Happy sad
Happy sad
Happy sad
Happy sad
Mad happy
Mad happy

这将每一行的文本用作关联数组的键seen。第一个seen[$0]++将导致打印之前已看到的行，因为与该行关联的值在第二个及以后的时间中将不为零。将seen[$0] == 2导致重新打印的行，如果是这样的线已经看到了第二次（不这样做，你会错过每一个重复的行出现一次）。

这与awk '!seen[$0]++'有时用于删除重复项而不进行排序的问题有关（请参见awk'！a [$ 0] ++'的工作原理？）。

要仅获得重复行的一个副本，请执行以下操作：

awk 'seen[$0]++ == 1' file

或者，

sort file | uniq -d

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-16

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何从文本文件中删除唯一的字符串？

如何从文本文件中删除唯一的字符串？

如何向文本文件添加新的唯一字符串

从文本文件中删除字符串

如何从保存在字符串变量中的文本文件中删除一行

如何从文本文件中的python中的字符串中删除空['']

如何从文本文件中删除第一个字符串和逗号

脚本：如何删除文本文件中的十六进制字符串

如何从文本文件的字符串中删除/丢弃某些单词？

如何在每一行中的特定字符串之后计算文本文件中的唯一单词？

如果文本文件包含字符串，则使用PowerShell从文本文件中删除行

如何搜索字符串并替换文本文件中的字符串？

使用bash从文本文件中删除保护字符之间的字符串

在文本文件中搜索多个字符串，如果退出则删除文件

如何从文本文件中删除俄语和阿拉伯语字符串

如何从制表符分隔的文本文件中的列的字符串值的末尾删除反斜杠？

如何删除文本文件中不是大于特定值的数字的所有行？（包括字符串）

BASH-如何删除文本文件中的所有数字，除非它们是特定字符串的一部分？

如何从另一个文件中删除基于字符串列表的多个文本文件的行？

资源下载搜索文本文件和字符串或替换字符串中删除字符

如何更新和删除文本文件上的指定字符串

删除行并替换文本文件中的字符串

Powershell从大文本文件中删除包含大量字符串的任何行

批处理-在文本文件中查找字符串并删除整行

删除行并替换文本文件中的字符串

从文本文件中删除通用字符串

从文本文件中删除字符串的超集

PHP 从文本文件中删除/替换字符串

删除包含特定字符串的文本文件中的行 /

如何从文本文件获取连接字符串？

如何从文本文件中分离字符串