从libreoffice命令行转换中剥离HTML标签

战面

我正在尝试将Linux服务器上的HTML文件转换为TXT文件。关键是转换工作正常,但仍将HTML标记保留在其中。是否有任何命令剥离转换中的所有HTML标签?

libreoffice4.2 --headless --convert-to txt 2000.html 2000.txt

在GUI中打开它Libreoffice在从HTML保存到TXT时已经剥离了HTML,因此也必须在命令行中完成此操作。

弗朗索瓦·布鲁诺

您需要告诉LibreOffice必须使用哪个过滤器才能执行转换(请参阅http://ask.libreoffice.org/en/question/2641/convert-to-command-line-parameter/

libreoffice4.2 --headless --convert-to txt:text 2000.html

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Libreoffice在命令行上将HTML转换为PDF会生成空白页

来自分类Dev

命令行中的转换命令错误

来自分类Dev

Unoconv / libreoffice命令行转换非常慢

来自分类Dev

通过命令行将html标签插入到html文件中

来自分类Dev

如何从命令行杀死libreoffice

来自分类Dev

如何从命令行杀死libreoffice

来自分类Dev

WPF-在标签中显示命令行参数

来自分类Dev

如何从命令行使用LibreOffice将.doc文件转换为.txt?

来自分类Dev

在pptx处将LibreOffice命令行字体替换为pdf转换

来自分类Dev

当运行Libreoffice实例时,使用命令行将ODS转换为CSV

来自分类Dev

在pptx处将LibreOffice命令行字体替换为pdf转换

来自分类Dev

bash中的命令行解析已转换为powershell

来自分类Dev

使用LibreOffice从命令行打印lpr命令吗?

来自分类Dev

使用命令行中的值填充现有的 LibreOffice 文档

来自分类Dev

Python命令行不接受标签

来自分类Dev

获取命令行黄瓜标签

来自分类Dev

如何在命令行中复制Knit HTML?

来自分类Dev

在命令行中从*排除

来自分类Dev

在命令行中从*排除

来自分类Dev

命令行中的管道

来自分类Dev

如何在Linux中从命令行将Calc的html文档格式转换为Excel格式?

来自分类Dev

命令行:将“-”转换为“û”

来自分类Dev

从命令行参数转换时间

来自分类Dev

ImageMagick命令行转换-限制值

来自分类Dev

铬快照转换:命令行选项

来自分类Dev

ImageMagick命令行转换-限制值

来自分类Dev

通过循环运行 LibreOffice 命令行脚本

来自分类Dev

如何通过终端命令行实现 Libreoffice 图标样式?

来自分类Dev

从命令行到 libreoffice 配置文件的路径