如何从网页中的嵌入式pdf获取所选文本?

造管机

这是pdf文档的示例,我需要从中提取用户的选择http://www.ada.gov/hospcombrprt.pdf如果我们查看页面源代码,我们将看到类似以下内容:

<html>
  <body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">  
     <embed width="100%" height="100%" name="plugin"        
     src="http://www.ada.gov/hospcombrprt.pdf" type="application/pdf">
  </body>
</html>

我们如何从此嵌入式pdf中获得用户的选择?

我发现一个帖子关于提取一个pdf文档的全文在这里和我相似张贴在这里它是写,有没有这样的可能性。

但是应该有一些出路。可能可以提取整个文本,然后以某种方式确定选择了什么?还是通过鼠标向下和向上事件中的鼠标光标位置确定选择?将不胜感激任何想法。

罗托拉

我怀疑这是否可能-如果是这样,将不会有通用的解决方案,因为每个PDF查看器都是不同的。

并非每个人都使用Adobe自己的Acrobat插件。福昕很受欢迎。这两个都是很可能不提供访问此信息的接口的插件。

现在,某些浏览器(例如Chrome和Firefox)提供了内置的PDF查看器,其工作原理与插件完全不同。

另外,您是否要在其他域上访问PDF?在这种情况下,同源策略将始终阻止访问此类信息。

最后,您需要考虑到并非每个用户都喜欢使用(甚至允许使用)PDF浏览器插件,因此在这种情况下,您的“解决方案”将无法使用。

还有一点:您使用的是过时的embed元素而不是事实,这object表明您正在使用非常古老的知识。

您可能需要退后一步,然后重新考虑您在此处尝试做的事情。什么是大局?您想达到什么目的?

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何访问网页中的嵌入式pdf文件

来自分类Dev

Watir-Webdriver如何使用Watir浏览器在Chrome中获取嵌入式pdf文本

来自分类Dev

如何仅在BeautifulSoup中获取标签的内部文本,而不包括嵌入式文本?

来自分类Dev

如何获取所选文本并显示它们?

来自分类Dev

在JTextPane中获取所选文本的标签

来自分类Dev

ggplot pdf中的嵌入式字体

来自分类Dev

Metro应用程序中的ComboBox如何获取所选文本及其相关ID

来自分类Dev

如何使用Google表格中的脚本/宏获取所选文本?

来自分类Dev

如何在Rich Edit中获取所选文本的字体名称

来自分类Dev

如何获取UIWebView中所选文本的坐标?

来自分类Dev

Firefox-使用双击时如何获取所选文本

来自分类Dev

如何获取所选文本的边界作为 CGRect?

来自分类Dev

如何从输入文本中删除所选文本?

来自分类Dev

在页面上的任何iframe中获取所选文本

来自分类Dev

热门在extjs面板中获取所选文本

来自分类Dev

在页面上的任何iframe中获取所选文本

来自分类Dev

如何在python中刮取网页上的嵌入式脚本

来自分类Dev

如何从网页下载嵌入式RTF文件?

来自分类Dev

如何在Openlayers3中编辑所选文本?

来自分类Dev

如何在PHPStorm中更改所选文本/代码的颜色

来自分类Dev

如何在Notepad ++中检查所选文本的字数?

来自分类Dev

如何在Qt中更改所选文本?

来自分类Dev

如何使用Google翻译在Windows中翻译所选文本?

来自分类Dev

如何增加所选文本中的所有数字?

来自分类Dev

如何在QTextBrowser中居中显示所选文本

来自分类Dev

如何从 React Native 的列表中更改所选文本的样式

来自分类Dev

如何从其他应用程序中获取所选文本并同时保留剪贴板文本

来自分类Dev

获取嵌入式pdf的当前页码

来自分类Dev

Chrome扩展程序获取所选文本

Related 相关文章

  1. 1

    如何访问网页中的嵌入式pdf文件

  2. 2

    Watir-Webdriver如何使用Watir浏览器在Chrome中获取嵌入式pdf文本

  3. 3

    如何仅在BeautifulSoup中获取标签的内部文本,而不包括嵌入式文本?

  4. 4

    如何获取所选文本并显示它们?

  5. 5

    在JTextPane中获取所选文本的标签

  6. 6

    ggplot pdf中的嵌入式字体

  7. 7

    Metro应用程序中的ComboBox如何获取所选文本及其相关ID

  8. 8

    如何使用Google表格中的脚本/宏获取所选文本?

  9. 9

    如何在Rich Edit中获取所选文本的字体名称

  10. 10

    如何获取UIWebView中所选文本的坐标?

  11. 11

    Firefox-使用双击时如何获取所选文本

  12. 12

    如何获取所选文本的边界作为 CGRect?

  13. 13

    如何从输入文本中删除所选文本?

  14. 14

    在页面上的任何iframe中获取所选文本

  15. 15

    热门在extjs面板中获取所选文本

  16. 16

    在页面上的任何iframe中获取所选文本

  17. 17

    如何在python中刮取网页上的嵌入式脚本

  18. 18

    如何从网页下载嵌入式RTF文件?

  19. 19

    如何在Openlayers3中编辑所选文本?

  20. 20

    如何在PHPStorm中更改所选文本/代码的颜色

  21. 21

    如何在Notepad ++中检查所选文本的字数?

  22. 22

    如何在Qt中更改所选文本?

  23. 23

    如何使用Google翻译在Windows中翻译所选文本?

  24. 24

    如何增加所选文本中的所有数字?

  25. 25

    如何在QTextBrowser中居中显示所选文本

  26. 26

    如何从 React Native 的列表中更改所选文本的样式

  27. 27

    如何从其他应用程序中获取所选文本并同时保留剪贴板文本

  28. 28

    获取嵌入式pdf的当前页码

  29. 29

    Chrome扩展程序获取所选文本

热门标签

归档