如何删除文件中两个标记之间的所有内容？

debugcn 发表于 Dev

l7ll7

我在一个文本文件中有一个文本，我想要删除\{{[}和{]}\}删除字符串之间的所有内容，包括这些字符串本身。这两个字符串可以位于不同的行，也可以位于同一行。无论哪种情况，在开始的那一行上\{{[}，我都不想删除它之前的文本，即左边的文本，而after之后的文本也是如此{]}\}。

这是一个示例：给定一个带有内容的文本文件

Bla Bla bla bla \{{[} more bla bla
even more bla bla bla bla. 

A lot of stuff might be here.

Bla bla {]}\} finally done.

Nonetheless, the \{{[} show {]}\} goes on.

该脚本应返回另一个包含内容的文本文件

Bla Bla bla bla  finally done.

Nonetheless, the  goes on.

不幸的是，这个简单的任务对我来说太难了sed。我对使用任何语言的任何解决方案都感到满意，只要我不必在标准linux机器上安装任何东西（已经安装了C和一些Java）即可。

斯蒂芬·查泽拉斯（Stephane Chazelas）

与perl：

perl -0777 -pe 's/\Q\{{[}\E.*?\Q{]}\}\E//gs'

请注意，在处理之前，整个输入都已加载到内存中。

\Qsomething\E是用于something将被视为一个文字串，而不是正则表达式。

要就地修改常规文件，请添加以下-i选项：

perl -0777 -i -pe 's/\Q\{{[}\E.*?\Q{]}\}\E//gs' file.txt

使用GNUawk或mawk：

awk -v 'RS=\\\\\\{\\{\\[}|\\{\\]}\\\\}' -v ORS= NR%2

在那里，我们定义的记录分隔为那些要么开始或结束标记（仅gawk和mawk支持RS是一个正则表达式在这里）。但是，我们需要逃避是正则表达式运算符（反斜杠，人物{，[），并反斜杠一次，因为它在参数专用-v（用于诸如\n，\b......），因此许多反斜杠。

然后，我们需要做的就是打印每隔一条记录。对于每个奇数记录NR%2都是1（true）。

对于这两种解决方案，我们都假定标记是匹配的，并且那些部分没有嵌套。

要使用GNU的最新版本就地修改文件awk，请添加-i inplace选项。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-9

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何删除文件中两个标记之间的所有内容？

如何删除文件中两个标记之间的所有内容？

如何使用 C# 删除两个括号标记之间的所有内容

如何在Python中的两个html标记之间获取所有内容？

如何通过删除两个条件之间的所有内容来压缩Pandas中的行

删除img src url中两个单词之间的所有内容，并使用htaccess从新的src提供文件

删除所有内容，两个文件除外

删除所有内容，两个文件除外

如何找到位于两个标记之间的字符串中的所有单词？

删除目录中除两个特定文件夹外的所有内容

删除/复制在Batch / Powershell中的两个特定时间之间获取的所有文件

选择两个标题锚标记之间的所有内容

查找两个标记之间的所有出现内容（Ruby）

选择两个标题锚标记之间的所有内容

查找两个标记之间的所有出现内容（Ruby）

'#if DEBUG'和'#endif'如何删除两个标记之间的内容

Ruby替换两个标记之间的文件内容

如何合并记录匹配1列的两个csv文件中的所有内容

如何在GitPython中的两个标签之间列出所有更改的文件

如果两个逗号之间有匹配项，如何匹配两个逗号之间的所有内容？

使用sed删除两个单词之间的所有内容？

用文件内容替换两个模式（包括两个模式）之间的所有行

如何使用sed删除两个字符之间的所有内容？

如何使用SED删除两个字符之间的所有内容？

删除两个字符之间的字符串中的所有内容

删除类中的所有元素，除了两个锚标记

MS Access：如何删除两个特定字符后的字符串中的所有内容

MS Access：如何删除两个特定字符后的字符串中的所有内容

删除文本文件中两个特定字符之间的内容

删除文本文件中两个特定字符之间的内容

删除文本文件中两个特定字符之间的内容