如何使用node.js抓取具有动态内容的页面?

周杰伦

我正在尝试抓取一个网站,但是我没有得到某些要素,因为这些要素是动态创建的。

我在node.js中使用了cheerio,下面是我的代码。

var request = require('request');
var cheerio = require('cheerio');
var url = "http://www.bdtong.co.kr/index.php?c_category=C02";

request(url, function (err, res, html) {
    var $ = cheerio.load(html);
    $('.listMain > li').each(function () {
        console.log($(this).find('a').attr('href'));
    });
});

此代码返回空响应,因为加载页面时,该页面<ul id="store_list" class="listMain">为空。

内容尚未添加。

如何使用node.js获取这些元素?如何抓取具有动态内容的页面?

萨菲

干得好;

var phantom = require('phantom');

phantom.create(function (ph) {
  ph.createPage(function (page) {
    var url = "http://www.bdtong.co.kr/index.php?c_category=C02";
    page.open(url, function() {
      page.includeJs("http://ajax.googleapis.com/ajax/libs/jquery/1.6.1/jquery.min.js", function() {
        page.evaluate(function() {
          $('.listMain > li').each(function () {
            console.log($(this).find('a').attr('href'));
          });
        }, function(){
          ph.exit()
        });
      });
    });
  });
});

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用Node.js抓取页面

来自分类Dev

如何使用Node.js抓取页面

来自分类Dev

如何使用python从具有多个动态选择字段的页面中抓取数据?

来自分类Dev

具有动态内容的团队页面-需要使用JQuery提取图像内容的帮助

来自分类Dev

如何使用基于npm的静态站点生成器在页面中呈现具有动态内容的组件?

来自分类Dev

如何使用Selenium抓取动态内容?

来自分类Dev

如何使用Selenium抓取动态内容?

来自分类Dev

使用Cookie抓取动态页面

来自分类Dev

使用python抓取动态内容

来自分类Dev

如何从使用javascript扩展内容的页面中抓取所有信息

来自分类Dev

如何使用 Splash 抓取 JS 页面?

来自分类Dev

使用node.js从多个JSON文件动态生成url和页面内容

来自分类Dev

如何使用Flask使页面内容动态化?

来自分类Dev

如何抓取页面的动态URL?

来自分类Dev

使用beautifulsoup抓取动态加载页面

来自分类Dev

如何使用生成器抓取页面内容?

来自分类Dev

如何使MigraDoc生成具有动态页面宽度的PDF?

来自分类Dev

如何使用JavaScript添加的动态内容抓取网页?

来自分类Dev

如何使用JavaScript添加的动态内容抓取网页?

来自分类Dev

使用python-Scrapy抓取动态内容

来自分类Dev

Web使用Splinter模块抓取动态内容

来自分类Dev

如何加载具有默认哈希(ID)内容的页面?

来自分类Dev

如何获取具有相同页面和内容名称的网站?

来自分类Dev

如何在iOS中创建具有动态内容的视图?

来自分类Dev

如何制作具有动态内容的图像滑块

来自分类Dev

Python Web抓取-当页面通过JS加载内容时如何获取漂亮的汤料?

来自分类Dev

如何抓取使用node.js异步加载数据的网站?

来自分类Dev

如何使用node.js抓取div标签?

来自分类Dev

如何检查具有实时(始终),(自动更新)请求的网络抓取页面?蟒蛇

Related 相关文章

  1. 1

    如何使用Node.js抓取页面

  2. 2

    如何使用Node.js抓取页面

  3. 3

    如何使用python从具有多个动态选择字段的页面中抓取数据?

  4. 4

    具有动态内容的团队页面-需要使用JQuery提取图像内容的帮助

  5. 5

    如何使用基于npm的静态站点生成器在页面中呈现具有动态内容的组件?

  6. 6

    如何使用Selenium抓取动态内容?

  7. 7

    如何使用Selenium抓取动态内容?

  8. 8

    使用Cookie抓取动态页面

  9. 9

    使用python抓取动态内容

  10. 10

    如何从使用javascript扩展内容的页面中抓取所有信息

  11. 11

    如何使用 Splash 抓取 JS 页面?

  12. 12

    使用node.js从多个JSON文件动态生成url和页面内容

  13. 13

    如何使用Flask使页面内容动态化?

  14. 14

    如何抓取页面的动态URL?

  15. 15

    使用beautifulsoup抓取动态加载页面

  16. 16

    如何使用生成器抓取页面内容?

  17. 17

    如何使MigraDoc生成具有动态页面宽度的PDF?

  18. 18

    如何使用JavaScript添加的动态内容抓取网页?

  19. 19

    如何使用JavaScript添加的动态内容抓取网页?

  20. 20

    使用python-Scrapy抓取动态内容

  21. 21

    Web使用Splinter模块抓取动态内容

  22. 22

    如何加载具有默认哈希(ID)内容的页面?

  23. 23

    如何获取具有相同页面和内容名称的网站?

  24. 24

    如何在iOS中创建具有动态内容的视图?

  25. 25

    如何制作具有动态内容的图像滑块

  26. 26

    Python Web抓取-当页面通过JS加载内容时如何获取漂亮的汤料?

  27. 27

    如何抓取使用node.js异步加载数据的网站?

  28. 28

    如何使用node.js抓取div标签?

  29. 29

    如何检查具有实时(始终),(自动更新)请求的网络抓取页面?蟒蛇

热门标签

归档