使用utf-8编码将doc和docx文件批量转换为txt以用于中东语言

失落的编码器

我有大约7k个用波斯语编写的文件,带有Microsoft worddoc/docx格式。我想将它们全部转换为txt格式,而不会丢失任何一个php Web应用程序。我知道很多带有Converting doc to txt标题的主题,但是没有一个解决了我的问题。知道我该怎么做吗?

这是这些文件之一的链接

edi9999

因为您找不到这么小的实用程序,所以我创建了一个:

https://github.com/edi9999/docx2txt

安装和使用:

npm install docx2txt -g
docx2txt input.docx

但是,这不会在段落之间放置空格。

也许您也可以使用pandoc:

pandoc input.docx -o output.txt

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用UTF8编码将sas数据集导出或转换为.txt文件?

来自分类Dev

使用php脚本将ANSI编码的文件转换为UTF-8编码的文件?

来自分类Dev

使用LibreOffice将wpd文件批量转换为docx

来自分类Dev

将具有UTF-8和CP-1251文件的目录批量转换为UTF-8

来自分类Dev

在C ++中使用utf8库将UTF 16转换为UTF8

来自分类Dev

使用iconv将Unicode代码点转换为C语言中的UTF-8

来自分类Dev

使用Jackson以UTF-8编码将Java列表转换为JSON数组

来自分类Dev

如何使用UTF-8编码将LPWSTR转换为char *

来自分类Dev

使用UTF-8读取.txt文件

来自分类Dev

使用ICU库将UTF-16转换为UTF-8

来自分类Dev

如何使用 C++ 将 UTF-16 转换为 UTF-8?

来自分类Dev

如何仅使用 php 将 .docx / .doc 文件转换为 .pdf

来自分类Dev

PyQt4使用Python 3.4错误地将文件路径转换为utf-8

来自分类Dev

无法使用PHP将文件从ANSI转换为UTF-8

来自分类Dev

Excel使用UTF8编码与UTF8-Bom编码保存CSV文件的行为

来自分类Dev

使用 Microsoft Office 将 pdf 批量转换为 docx

来自分类Dev

如何将csv文件编码转换为utf-8

来自分类Dev

在sqlplus中如何更改或将特定文件编码转换为utf8

来自分类Dev

使用UTF-8的Python Unicode编码

来自分类Dev

使用RMySQL的UTF8编码

来自分类Dev

使用UTF-8编码解决BOM

来自分类Dev

无法编码的字符,用于编码ASCII,但是我的文件使用UTF-8

来自分类Dev

将编码的 html 实体转换为 utf-8

来自分类Dev

使用Dart语言将字符串从ISO-8859-2转换为UTF-8

来自分类Dev

使用Dart语言将字符串从ISO-8859-2转换为UTF-8

来自分类Dev

如何使用Apache POI将.docx转换为.doc

来自分类Dev

使用C#将.doc转换为.docx

来自分类Dev

使用保留表将.doc / .docx转换为文本

来自分类Dev

无法使用UTF8编码转换HttpResponseMessage

Related 相关文章

  1. 1

    如何使用UTF8编码将sas数据集导出或转换为.txt文件?

  2. 2

    使用php脚本将ANSI编码的文件转换为UTF-8编码的文件?

  3. 3

    使用LibreOffice将wpd文件批量转换为docx

  4. 4

    将具有UTF-8和CP-1251文件的目录批量转换为UTF-8

  5. 5

    在C ++中使用utf8库将UTF 16转换为UTF8

  6. 6

    使用iconv将Unicode代码点转换为C语言中的UTF-8

  7. 7

    使用Jackson以UTF-8编码将Java列表转换为JSON数组

  8. 8

    如何使用UTF-8编码将LPWSTR转换为char *

  9. 9

    使用UTF-8读取.txt文件

  10. 10

    使用ICU库将UTF-16转换为UTF-8

  11. 11

    如何使用 C++ 将 UTF-16 转换为 UTF-8?

  12. 12

    如何仅使用 php 将 .docx / .doc 文件转换为 .pdf

  13. 13

    PyQt4使用Python 3.4错误地将文件路径转换为utf-8

  14. 14

    无法使用PHP将文件从ANSI转换为UTF-8

  15. 15

    Excel使用UTF8编码与UTF8-Bom编码保存CSV文件的行为

  16. 16

    使用 Microsoft Office 将 pdf 批量转换为 docx

  17. 17

    如何将csv文件编码转换为utf-8

  18. 18

    在sqlplus中如何更改或将特定文件编码转换为utf8

  19. 19

    使用UTF-8的Python Unicode编码

  20. 20

    使用RMySQL的UTF8编码

  21. 21

    使用UTF-8编码解决BOM

  22. 22

    无法编码的字符,用于编码ASCII,但是我的文件使用UTF-8

  23. 23

    将编码的 html 实体转换为 utf-8

  24. 24

    使用Dart语言将字符串从ISO-8859-2转换为UTF-8

  25. 25

    使用Dart语言将字符串从ISO-8859-2转换为UTF-8

  26. 26

    如何使用Apache POI将.docx转换为.doc

  27. 27

    使用C#将.doc转换为.docx

  28. 28

    使用保留表将.doc / .docx转换为文本

  29. 29

    无法使用UTF8编码转换HttpResponseMessage

热门标签

归档