如何将循环拆分为段

奥立佛

我有一个非常简单的问题(我认为),但是在stackoverflow的任何地方都找不到答案。我编写了一个循环,该循环使用repec_id来自大型数据集(150,000个条目)的学术论文条目,然后从名为RePEc的数据库中为每篇论文提取参考文献列表。看起来像这样:

url_base <- "http://citec.repec.org/api/amf/"
##for loop
references_1 <-vector("list", length=length(df$repec_id))
for(i in seq_along(df$repec_id))
    try({get_data <- read_html(paste0(url_base, df$repec_id[i], usercode))
            get_references <- html_nodes(get_data,'references') %>% html_nodes("text") %>% html_attr("ref")
            references_1[[i]] <- paste((get_references), collapse =" ")
            print(i)
    }) 

为了提高速度,我想运行5次循环,每次分析30,000个ID(例如ID 1-30,000,然后ID 30,001至60,000,然后ID 60,001至90,000,依此类推),然后将它们合并为一个列表(references_1)。有人知道我该怎么做吗?

不幸的是,这usercode仅适用于我的IP,因此该示例不可重现,但我认为(希望)我的问题不依赖可重现...预先感谢您的帮助!

林恩

为了解决这个问题,而不是执行seq_along,一个选项是为要运行的5次指定每次循环遍历的i范围。

start <- 1
for(i in start:min(start + 29999, length(df$repec_id)){
...

那应该将您设置起始值的任何值作为参数,然后从那里循环进行总共30,000次迭代-除非30,000次会使您超过df $ respec_id的长度,这就是最小值在那里的原因。

就是说,我不确定这将如何加快处理速度,除非您担心要中断该过程,所以您不只是让它无限期地运行。(如果是这种情况,我通常只将print(i)作为循环的一部分来跟踪我的进度。)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何将Math工作拆分为工作线程Java

来自分类Dev

如何将字符串列表拆分为记录?

来自分类Dev

Scala:如何将字符串拆分为地图

来自分类Dev

如何将字符向量拆分为数据帧?

来自分类Dev

如何将TypeScript类拆分为多个文件?

来自分类Dev

PHP-如何将长数组(句子)拆分为较小的数组(关键字)以通过foreach循环

来自分类Dev

如何将A * A std :: array拆分为B * B的块?

来自分类Dev

如何将数组拆分为较小的数组PHP

来自分类Dev

如何将Koa路由拆分为单独的文件?

来自分类Dev

如何将数组拆分为单独的数组(R)?

来自分类Dev

如何将QML代码拆分为多个文件?

来自分类Dev

如何将React JS组件拆分为多个文件

来自分类Dev

如何将JavaScript对象拆分为较小的部分

来自分类Dev

如何将数据拆分为datagridview

来自分类Dev

如何将模块拆分为多个文件

来自分类Dev

如何将CSV文件的列拆分为单独的文件?

来自分类Dev

如何将字符串拆分为多个部分以在循环中填充字典

来自分类Dev

如何将文件拆分为字符

来自分类Dev

如何将数组划分为段,然后使用python numpy执行段的子段?

来自分类Dev

如何将LineString拆分为段

来自分类Dev

如何将嵌套对象拆分为对象数组-避免for循环

来自分类Dev

如何将值列表拆分为变量以及如何使插入函数在postgreSQL中的for每个循环下工作

来自分类Dev

如何将数组拆分为符号?

来自分类Dev

如何将[String]拆分为行?

来自分类Dev

如何将数据拆分为字典?

来自分类Dev

如何将时间段划分为部分?

来自分类Dev

如何将 CSV 拆分为 CSV?

来自分类Dev

如何将 if() 拆分为 && 而不是 ||

来自分类Dev

如何将列拆分为行

Related 相关文章

热门标签

归档