java html解析器,用于读取javascript生成的内容

迪努普·奈尔

我正在jsoup通过以下功能来读取网页。

public Document getDocuement(String url){
        Document doc = null;
        try {
            doc = Jsoup.connect(url).timeout(20*1000).userAgent("Mozilla").get();
        } catch (Exception e) {
            return null;
        }
        return doc;
    }

但是,每当我尝试阅读包含javascript生成内容的网页时jsoup都不会阅读这些内容。也就是说,页面的实际内容是通过某些javascript调用加载的。因此,该链接的页面源中不存在该内容。例如,此博客:http : //blog.rapporter.net/search/label/r解析网页时,是否有办法获取javascript生成的内容Jsoup如果否,请提出任何可以解决此问题的java html解析器。

托马斯·乌里格

您不能使用Jsoup做到这一点Jsoup解析HTML,通常要等待AJAX​​请求或JavaScript内容,您需要一个可以执行此JavaScript的浏览器才能从中获取一些输出。JavaScript逻辑可能很复杂,因此执行JavaScript和加载内容并不是一件容易的事(只需看看浏览器,JS和DOM有多复杂)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

java html解析器,用于读取javascript生成的内容

来自分类Dev

java中的javascript解析器

来自分类Dev

在Java中读取xml文件和解析器

来自分类Dev

在Java中读取xml文件和解析器

来自分类Dev

不会更改标签的Java HTML解析器

来自分类Dev

适用于Java / Scala的HTTP解析器/渲染器库

来自分类Dev

Java日期解析器,可读取所有英国日期格式

来自分类Dev

java.lang.IllegalStateException:找不到用于urn:security:1.1的解析器

来自分类Dev

为Java中的现有二进制协议生成解析器

来自分类Dev

Java对象的JSONPath解析器

来自分类Dev

Java JSON简单解析器

来自分类Dev

解析器中的Java异常处理

来自分类Dev

Java Sax解析器错误

来自分类Dev

Java android JsonArray解析器

来自分类Dev

容错Java xml解析器

来自分类Dev

Java解析器时间问题

来自分类Dev

无法使用Jsoup HTML解析器Java实现某些功能

来自分类Dev

无法使用Jsoup HTML解析器Java实现某些功能

来自分类Dev

解析Java代码模板时速度解析器崩溃

来自分类Dev

Java-XML解析器和下载器

来自分类Dev

Java-XML解析器和下载器

来自分类Dev

参数解析器之后的Java手动验证

来自分类Dev

AST解析器获取Java类的名称

来自分类Dev

Java字节码是否有通用解析器?

来自分类Dev

Java API中的条件字符串解析器?

来自分类Dev

用Java分隔协议解析器和处理程序

来自分类Dev

Java SAX解析器命名空间引发NullPointerException

来自分类Dev

Java中的XML JDOM解析器中的OutOfMemoryError

来自分类Dev

在Java中使用时区测试日期解析器