如何从字节数组中提取 Word 文档文本?

比拉尔先生

我正在尝试获取 Word 或 Excel 文件的文本。但是,我只能访问此 Word 文件的二进制数组,但无法获取该文件的路径,因此是否可以转换 Word 文件的二进制数组串?我试过这段代码,但它无法帮助我,因为我无法获得文件的路径

        StringBuilder text = new StringBuilder();
        Microsoft.Office.Interop.Word.Application word = new Microsoft.Office.Interop.Word.Application();
        object miss = System.Reflection.Missing.Value;
        object path = filePath;
        object readOnly = true;
        Microsoft.Office.Interop.Word.Document docs = word.Documents.Open(ref path, ref miss, ref readOnly, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss, ref miss);

        for (int i = 0; i < docs.Paragraphs.Count; i++)
        {
            text.Append(" \r\n " + docs.Paragraphs[i + 1].Range.Text.ToString());
        }

        return text.ToString();
用户3188639

你不能直接使用字节数组,但你可以找到一些可以打开和操作 Word 文档的库。通常,这些库可以从流中打开 Word 文档。

我对 Syncfusion 及其 DocIO 库有一些经验,它们可以做到这一点。它具有免费的社区许可证,因此可用于测试或小型团队。

你可以像这样使用它:

WordDocument doc = new WordDocument();
byte[] wordBytes = …
using (var ms = new MemoryStream(wordBytes))
{
     doc.Open(ms, FormatType.Automatic);
}

拥有 Word 文档后,您可以从中提取文本。

免责声明:我与 Syncfusion 公司或其任何员工没有任何关系。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用VBA从Word文档中的形状中提取文本?

来自分类Dev

将Word文档转换为内存中的pdf字节数组

来自分类Dev

如何从Linux的Word文档中提取图像

来自分类Dev

从字节数组创建 XPS 文档

来自分类Dev

如何在Word文档顶部的表格上方插入文本?

来自分类Dev

如何在C#中将文本从RTF插入Word文档

来自分类Dev

从Jupyter Notebook中的ipyWidgets通过FileUpload上传的MS Word文档中提取文本

来自分类Dev

OpenXML使用C#从Word文档中提取突出显示的文本

来自分类Dev

从word文档中提取章节号

来自分类Dev

如何在Perl中将图像或文本文件转换为字节数组?

来自分类Dev

从字节数组填充TXTextControl时,如何避免丢失文本格式?

来自分类Dev

C#如何从字节数组中提取字节?具有已知的起始字节

来自分类Dev

在文本框中显示字节数组

来自分类Dev

Word - 如何在文档 B 中显示文档 A 中的一段文本,当我在文档 A 或 B 中对其进行更改时,该文本会实时更新?

来自分类Dev

如何关闭Word文档

来自分类Dev

从扫描的文档中提取文本

来自分类Dev

从扫描的文档中提取文本

来自分类Dev

提取MS Word文档格式元素以及原始文本信息

来自分类Dev

提取MS Word文档格式元素以及原始文本信息

来自分类Dev

VBA Word:在Word文档中找到的文本之前插入文本

来自分类Dev

python-从Microsoft Word中提取文本

来自分类Dev

如何“标记” Word文档的区域,以使使用Open Office XML轻松向其中添加文本?

来自分类Dev

如何使用python-docx替换Word文档中的文本并保存

来自分类Dev

VSTO中的插件-如何使用功能区通过按钮从Word文档中获取文本

来自分类Dev

apache poi word(XWPF)如何更改文档中的文本方向(而不是段落对齐)?

来自分类Dev

如何使用python docx获取Word文档中的实际文本样式

来自分类Dev

如何将富文本格式写入C#中的htm文件生成的Word文档

来自分类Dev

如何使用“ Ctrl + Shift + V”将纯格式的无格式文本粘贴到Word文档中?

来自分类Dev

如何在Word 2016文档中链接某些文本?

Related 相关文章

  1. 1

    如何使用VBA从Word文档中的形状中提取文本?

  2. 2

    将Word文档转换为内存中的pdf字节数组

  3. 3

    如何从Linux的Word文档中提取图像

  4. 4

    从字节数组创建 XPS 文档

  5. 5

    如何在Word文档顶部的表格上方插入文本?

  6. 6

    如何在C#中将文本从RTF插入Word文档

  7. 7

    从Jupyter Notebook中的ipyWidgets通过FileUpload上传的MS Word文档中提取文本

  8. 8

    OpenXML使用C#从Word文档中提取突出显示的文本

  9. 9

    从word文档中提取章节号

  10. 10

    如何在Perl中将图像或文本文件转换为字节数组?

  11. 11

    从字节数组填充TXTextControl时,如何避免丢失文本格式?

  12. 12

    C#如何从字节数组中提取字节?具有已知的起始字节

  13. 13

    在文本框中显示字节数组

  14. 14

    Word - 如何在文档 B 中显示文档 A 中的一段文本,当我在文档 A 或 B 中对其进行更改时,该文本会实时更新?

  15. 15

    如何关闭Word文档

  16. 16

    从扫描的文档中提取文本

  17. 17

    从扫描的文档中提取文本

  18. 18

    提取MS Word文档格式元素以及原始文本信息

  19. 19

    提取MS Word文档格式元素以及原始文本信息

  20. 20

    VBA Word:在Word文档中找到的文本之前插入文本

  21. 21

    python-从Microsoft Word中提取文本

  22. 22

    如何“标记” Word文档的区域,以使使用Open Office XML轻松向其中添加文本?

  23. 23

    如何使用python-docx替换Word文档中的文本并保存

  24. 24

    VSTO中的插件-如何使用功能区通过按钮从Word文档中获取文本

  25. 25

    apache poi word(XWPF)如何更改文档中的文本方向(而不是段落对齐)?

  26. 26

    如何使用python docx获取Word文档中的实际文本样式

  27. 27

    如何将富文本格式写入C#中的htm文件生成的Word文档

  28. 28

    如何使用“ Ctrl + Shift + V”将纯格式的无格式文本粘贴到Word文档中?

  29. 29

    如何在Word 2016文档中链接某些文本?

热门标签

归档