我有大约7k个用波斯语编写的文件,带有Microsoft worddoc/docx
格式。我想将它们全部转换为txt
格式,而不会丢失任何一个php Web应用程序。我知道很多带有Converting doc to txt
标题的主题,但是没有一个解决了我的问题。知道我该怎么做吗?
这是这些文件之一的链接。
因为您找不到这么小的实用程序,所以我创建了一个:
https://github.com/edi9999/docx2txt
安装和使用:
npm install docx2txt -g
docx2txt input.docx
但是,这不会在段落之间放置空格。
也许您也可以使用pandoc:
pandoc input.docx -o output.txt
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句