使用 Node.js 从网页中抓取 URL

约翰·杰克逊

我正在尝试从网站上抓取所有 URL 并将它们放入一个数组中。我有一个关于数组索引的问题。如果我将 2 之类的索引号添加到数组 [2] 中,命令行将回复“未定义”。如果我删除索引并打印整个数组,它会逐行打印所有 URL。我希望每个 URL 都是它自己的索引,例如:

  • array[0] = 找到的第一个 URL
  • 数组[1] = 找到第二个 URL
  • array[2] = Thirs URL found etc.

任何人都可以指出我正确的方向吗?谢谢你。

  var request = require('request');
    var cheerio = require('cheerio');

   var url = 'http://www.hobo-web.co.uk/';

    request(url, function(err, resp, body){
      $ = cheerio.load(body);
      links = $('a'); //use your CSS selector here
      $(links).each(function(i, link){
        var array = $(link).attr('href');
        console.log(array[2]);

      });
    });``
驯鹿密码

您需要最初将数组创建为可在.each循环内访问的变量,然后继续将 href 值推送给它。

var request = require('request');
var cheerio = require('cheerio');

var url = 'http://www.hobo-web.co.uk/';

var array = [];

request(url, function(err, resp, body){
  $ = cheerio.load(body);
  links = $('a');
  $(links).each(function(i, link){
    var href = $(link).attr('href');
    array.push(href);
  });
});

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

建立一个使用Node.js在浏览器中抓取RSS的网页

来自分类Dev

从网页中抓取URL,以进一步从第一次抓取中抓取单个URL(重新使用抓取数据中的URL)

来自分类Dev

在 node.js 中抓取网页以获得应用于网页每个元素的所有 CSS 属性

来自分类Dev

使用包含 Python 和漂亮汤的 URL 的 .txt 文件从多个网页中抓取数据

来自分类Dev

如何使用puppeteer(Node.js applicatie)抓取instagram帖子URL

来自分类Dev

使用dryscrape 抓取react.js 网页

来自分类Dev

如何使用Node.js观看URL?

来自分类Dev

没有Node js的网页抓取可能吗?

来自分类Dev

如何使用Node.js抓取页面

来自分类Dev

使用请求模块抓取Node.js

来自分类Dev

使用Node.js进行Web抓取

来自分类Dev

如何使用Node.js抓取页面

来自分类Dev

使用Python从多个网页中抓取文字

来自分类Dev

使用BeautifulSoup从网页中抓取特定链接

来自分类Dev

Node.js中的URL组件编码

来自分类Dev

验证Node.js中的URL

来自分类Dev

node.js中的每个URL限制

来自分类Dev

在node.js中捕获请求的URL

来自分类Dev

使用puppeteer将网络抓取的数据上传到node.js中的Firebase云存储

来自分类Dev

html使用cheerio js和node js抓取td元素

来自分类Dev

如何使用Node.js和Axios将文件上传到AWS中的预签名URL?

来自分类Dev

使用(multer)处理node.js中的图像后图像的URL问题

来自分类Dev

如何使用Node.js在URL中添加我的Web应用程序名称?

来自分类Dev

使用node.js无法获取存储在filepicker中的文件的URL

来自分类Dev

如何在前端使用node js显示modgodb中存储的图片URL路径

来自分类Dev

使用Node.JS查询MySQL并在网页中显示结果

来自分类Dev

使用Node.JS查询MySQL并在网页中显示结果

来自分类Dev

使用Node.js的网页中的JWT身份验证系统

来自分类Dev

如何使用完整的URL调试Node.js?

Related 相关文章

  1. 1

    建立一个使用Node.js在浏览器中抓取RSS的网页

  2. 2

    从网页中抓取URL,以进一步从第一次抓取中抓取单个URL(重新使用抓取数据中的URL)

  3. 3

    在 node.js 中抓取网页以获得应用于网页每个元素的所有 CSS 属性

  4. 4

    使用包含 Python 和漂亮汤的 URL 的 .txt 文件从多个网页中抓取数据

  5. 5

    如何使用puppeteer(Node.js applicatie)抓取instagram帖子URL

  6. 6

    使用dryscrape 抓取react.js 网页

  7. 7

    如何使用Node.js观看URL?

  8. 8

    没有Node js的网页抓取可能吗?

  9. 9

    如何使用Node.js抓取页面

  10. 10

    使用请求模块抓取Node.js

  11. 11

    使用Node.js进行Web抓取

  12. 12

    如何使用Node.js抓取页面

  13. 13

    使用Python从多个网页中抓取文字

  14. 14

    使用BeautifulSoup从网页中抓取特定链接

  15. 15

    Node.js中的URL组件编码

  16. 16

    验证Node.js中的URL

  17. 17

    node.js中的每个URL限制

  18. 18

    在node.js中捕获请求的URL

  19. 19

    使用puppeteer将网络抓取的数据上传到node.js中的Firebase云存储

  20. 20

    html使用cheerio js和node js抓取td元素

  21. 21

    如何使用Node.js和Axios将文件上传到AWS中的预签名URL?

  22. 22

    使用(multer)处理node.js中的图像后图像的URL问题

  23. 23

    如何使用Node.js在URL中添加我的Web应用程序名称?

  24. 24

    使用node.js无法获取存储在filepicker中的文件的URL

  25. 25

    如何在前端使用node js显示modgodb中存储的图片URL路径

  26. 26

    使用Node.JS查询MySQL并在网页中显示结果

  27. 27

    使用Node.JS查询MySQL并在网页中显示结果

  28. 28

    使用Node.js的网页中的JWT身份验证系统

  29. 29

    如何使用完整的URL调试Node.js?

热门标签

归档