帮助使用sed脚本删除Wikipedia引文编号

debugcn 发表于 Dev

daltonfury42

我才刚刚开始学习sed和awk。我明天必须提交作业，这是维基百科的复制粘贴。只是机会练习一些sed脚本！

所以我有html格式的文档。现在，我无需替换[<number>]任何内容。我该怎么做？

这是我尝试过的方法，但我认为它甚至与我想要的模式都不匹配：

cat content.xml | sed 's/\[\d+\]/ /g' > content2.xml

下一步，我将实现这些模式的替换，这些模式是超链接，但是即使上述简单模式也无法匹配：

<a href="https://en.wikipedia.org/wiki/Immune_system">immune system</a>

然后删除引用：

<a name="cite_ref-Gleeson2007_27-0"/><a href="https://en.wikipedia.org/wiki/Physical_exercise#cite_note-Gleeson2007-27">[27]</a>

用户名

您走错了方向，应该改用XML / XSLT :)（XML样式表）。用于ODT或XHTML。对于ODT，宏可能会更好，但我不知道。

看一下这个公认的答案：RegEx匹配除XHTML自包含标签之外的其他开放标签

该答案中的解决方案“如何用其描述替换Libreoffice中的所有图像”也应该对您有效，而无需进行任何修改。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-11

我来说两句

0条评论

登录后参与评论

来自分类Dev

甚至可以使用Microsoft word替换Wikipedia的引文吗？

来自分类Dev

使用sed脚本从文件中删除“ <<”和“ >>”

来自分类Dev

AWK / SED Shell脚本帮助

来自分类Dev

使用sed命令从bash脚本中的文件中删除行

来自分类Dev

使用sed -i进行正则表达式帮助以获取tampermonkey脚本

来自分类Dev

需要帮助在 bash 脚本中使用 egrep 匹配模式 [SED/GREP]

来自分类Dev

sed删除匹配行脚本

来自分类Dev

帮助sed-使用某些字符串删除特定行

来自分类Dev

在脚本中使用Wikipedia Lua模块

来自分类Dev

使用sed对出现的事件进行编号

来自分类Dev

使用sed删除行号

来自分类Dev

使用sed删除标签

来自分类Dev

无法使用sed删除

来自分类Dev

使用sed删除字符

来自分类Dev

使用 Sed 删除空格

来自分类Dev

需要帮助使用sed剥离字符

来自分类Dev

需要帮助使用sed剥离字符

来自分类Dev

删除使用罗马数字编号

来自分类Dev

使用inode编号在Linux上删除文件

来自分类Dev

sed脚本删除断字字符

来自分类Dev

我无法从Shell脚本中的文本中删除新行（使用sed和grep）

来自分类Dev

我无法从Shell脚本中的文本中删除新行（使用sed和grep）

来自分类Dev

如何使用sed从文本文件中删除脚本标签

来自分类Dev

如何回显，使用Bash脚本中的SED命令删除了几行？

来自分类Dev

Bash脚本帮助-Tar无法使用变量？

来自分类Dev

Bash脚本帮助-Tar无法使用变量？

来自分类Dev

如何使用 curl/solrctl 命令从 Solr 中删除索引文件

来自分类Dev

如何使用sed删除行？

来自分类Dev

使用sed从CSV删除列

Related 相关文章

文章