我的任务是将所有注释翻译成一个较大的MS Word文件。为了起草法案,我需要计算所有原始注释“气泡”中的所有字符(包括空格)。现在如何做到这一点?手动计数将很困难。
可以以某种方式将所有评论保存在一个单独的文本文件中以便对其进行计数吗?
PS我刚刚尝试将DOC文档另存为MHT文件。所有评论都整齐地显示在页面底部。我可以全部选择它们,然后右键单击“复制”。但是,当我打开一个新的MS Word文档并单击“粘贴”时,没有任何反应。
docx文件是一个zip存档,其中包含许多xml文件。其中一个文件是“ comments.xml”,其中包含所有注释。在我的Linux系统上,我执行了以下操作以提取所有注释的文本。我做了一个简单的test.docx文件,并在其中添加了注释。
unzip test.docx
xmllint --xpath "//*[local-name()='t']/text()" word/comments.xml
其中返回所有注释文本。此后,这只是一个简单的字符/单词数。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句