使用RVest进行刮擦和循环的简单解决方案,将for循环的结果存储在变量中

偷偷摸摸的

我需要使用R和rvest库从3个页面(每个页面有150个链接)收集链接。我使用了for循环来浏览页面。我知道这是一个非常基本的问题,已经在其他地方得到了回答:跨多个页面的R Web抓取 使用Rvest进行刮擦和循环我尝试了以下代码的不同版本。他们大多数人都工作了,但只返回了50个链接,而不是150个链接

library(rvest)

baseurl <- "https://www.ebay.co.uk/sch/i.html?_from=R40&_nkw=chain+and+sprocket&_sacat=0&_pgn="
n <- 1:3
nextpages <- paste0(baseurl, n)

for(i in nextpages){
  html <- read_html(nextpages)
  links <- html %>% html_nodes("a.vip") %>% html_attr("href")
}

该代码预计将返回全部150个而不是仅返回50个。

用户名

您将在每次迭代中覆盖links变量,因此最终只能获得最后50个链接。

但是您正在循环使用'i'变量,而您的read_html()函数使用nextpages变量,该变量实际上是3个URL的向量。您应该得到一个错误。

尝试这个:

links <- c()
for(i in nextpages){
  html <- read_html(i)
  links <- c(links, html %>% html_nodes("a.vip") %>% html_attr("href"))
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

For循环将结果存储在变量中

来自分类Dev

for循环(i)在循环外使用的变量或可能的解决方案?

来自分类Dev

需要访问函数中定义的变量。嵌套循环是解决方案吗?

来自分类Dev

如何在Javascript中为变量内部编写for循环,或者有替代解决方案?

来自分类Dev

需要解决方案C ++循环和条件

来自分类Dev

在MSBuild中的解决方案中循环项目

来自分类Dev

在MSBuild中的解决方案中循环项目

来自分类Dev

在Matlab或Octave中使用fzero,避免循环和复杂的解决方案

来自分类Dev

R中给定代码的循环解决方案是什么?

来自分类Dev

在 JavaScript 中创建“运行循环”的最佳解决方案

来自分类Dev

不使用for循环的算法问题解决方案

来自分类Dev

将for循环结果存储为bash中的变量

来自分类Dev

将for循环结果存储为php中的变量

来自分类Dev

将for循环的结果作为单个变量存储在Perl中

来自分类Dev

将循环结果存储在sh的shell变量中

来自分类Dev

Javascript - 如何将 for 循环的结果存储到变量中?

来自分类Dev

交替for循环的c ++通用解决方案

来自分类Dev

最佳的SQL无循环解决方案

来自分类Dev

是否有for循环或purrr解决方案?

来自分类Dev

嵌套“ For”循环的替代解决方案

来自分类Dev

django 循环导入解决方案

来自分类Dev

从Windows 10升级以64%的启动循环进行升级(无需使用USB即可解决方案)

来自分类Dev

我使用哪种简单的数据库解决方案将解析的变量从eclipse提取到数据库

来自分类Dev

在循环单链接列表中查找循环开始的解决方案

来自分类Dev

存储重定向轨道的URL作为“重定向循环”错误的解决方案

来自分类Dev

将结果存储在R中的for循环内

来自分类Dev

将 for 循环的结果存储在数组中

来自分类Dev

将 for 循环迭代的结果存储在字典中

来自分类Dev

如何使用 for 循环将函数输出存储在单独的变量中?

Related 相关文章

  1. 1

    For循环将结果存储在变量中

  2. 2

    for循环(i)在循环外使用的变量或可能的解决方案?

  3. 3

    需要访问函数中定义的变量。嵌套循环是解决方案吗?

  4. 4

    如何在Javascript中为变量内部编写for循环,或者有替代解决方案?

  5. 5

    需要解决方案C ++循环和条件

  6. 6

    在MSBuild中的解决方案中循环项目

  7. 7

    在MSBuild中的解决方案中循环项目

  8. 8

    在Matlab或Octave中使用fzero,避免循环和复杂的解决方案

  9. 9

    R中给定代码的循环解决方案是什么?

  10. 10

    在 JavaScript 中创建“运行循环”的最佳解决方案

  11. 11

    不使用for循环的算法问题解决方案

  12. 12

    将for循环结果存储为bash中的变量

  13. 13

    将for循环结果存储为php中的变量

  14. 14

    将for循环的结果作为单个变量存储在Perl中

  15. 15

    将循环结果存储在sh的shell变量中

  16. 16

    Javascript - 如何将 for 循环的结果存储到变量中?

  17. 17

    交替for循环的c ++通用解决方案

  18. 18

    最佳的SQL无循环解决方案

  19. 19

    是否有for循环或purrr解决方案?

  20. 20

    嵌套“ For”循环的替代解决方案

  21. 21

    django 循环导入解决方案

  22. 22

    从Windows 10升级以64%的启动循环进行升级(无需使用USB即可解决方案)

  23. 23

    我使用哪种简单的数据库解决方案将解析的变量从eclipse提取到数据库

  24. 24

    在循环单链接列表中查找循环开始的解决方案

  25. 25

    存储重定向轨道的URL作为“重定向循环”错误的解决方案

  26. 26

    将结果存储在R中的for循环内

  27. 27

    将 for 循环的结果存储在数组中

  28. 28

    将 for 循环迭代的结果存储在字典中

  29. 29

    如何使用 for 循环将函数输出存储在单独的变量中?

热门标签

归档