这是pdf文档的示例,我需要从中提取用户的选择http://www.ada.gov/hospcombrprt.pdf。如果我们查看页面源代码,我们将看到类似以下内容:
<html>
<body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">
<embed width="100%" height="100%" name="plugin"
src="http://www.ada.gov/hospcombrprt.pdf" type="application/pdf">
</body>
</html>
我们如何从此嵌入式pdf中获得用户的选择?
我发现一个帖子关于提取一个pdf文档的全文在这里和我相似张贴在这里它是写,有没有这样的可能性。
但是应该有一些出路。可能可以提取整个文本,然后以某种方式确定选择了什么?还是通过鼠标向下和向上事件中的鼠标光标位置确定选择?将不胜感激任何想法。
我怀疑这是否可能-如果是这样,将不会有通用的解决方案,因为每个PDF查看器都是不同的。
并非每个人都使用Adobe自己的Acrobat插件。福昕很受欢迎。这两个都是很可能不提供访问此信息的接口的插件。
现在,某些浏览器(例如Chrome和Firefox)提供了内置的PDF查看器,其工作原理与插件完全不同。
另外,您是否要在其他域上访问PDF?在这种情况下,同源策略将始终阻止访问此类信息。
最后,您需要考虑到并非每个用户都喜欢使用(甚至允许使用)PDF浏览器插件,因此在这种情况下,您的“解决方案”将无法使用。
还有一点:您使用的是过时的embed
元素而不是事实,这object
表明您正在使用非常古老的知识。
您可能需要退后一步,然后重新考虑您在此处尝试做的事情。什么是大局?您想达到什么目的?
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句