我才刚刚开始学习sed和awk。我明天必须提交作业,这是维基百科的复制粘贴。只是机会练习一些sed脚本!
所以我有html格式的文档。现在,我无需替换[<number>]
任何内容。我该怎么做?
这是我尝试过的方法,但我认为它甚至与我想要的模式都不匹配:
cat content.xml | sed 's/\[\d+\]/ /g' > content2.xml
下一步,我将实现这些模式的替换,这些模式是超链接,但是即使上述简单模式也无法匹配:
<a href="https://en.wikipedia.org/wiki/Immune_system">immune system</a>
然后删除引用:
<a name="cite_ref-Gleeson2007_27-0"/><a href="https://en.wikipedia.org/wiki/Physical_exercise#cite_note-Gleeson2007-27">[27]</a>
您走错了方向,应该改用XML / XSLT :)(XML样式表)。用于ODT或XHTML。对于ODT,宏可能会更好,但我不知道。
看一下这个公认的答案:RegEx匹配除XHTML自包含标签之外的其他开放标签
该答案中的解决方案“如何用其描述替换Libreoffice中的所有图像”也应该对您有效,而无需进行任何修改。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句