dplyr中的滑动组

杰克斯特德

我有一个数据集,其中包含每个日期的许多唯一标识符,例如

df <- data.frame(date = as.Date(c("2016-01-01", "2016-01-01", "2016-01-02", "2016-01-02")), 
ids = c(3, 4, 1, 3))

然后,我想对这些信息进行总结,以获取当前日期出现的新的唯一ID的数量。例如,在1月1日有两个唯一ID(3和4)。但是在1月2日,只有一个新的唯一ID(1)。因此,结果数据框应如下所示:

date          n_new_unique_ids
2016-01-01                   2
2016-01-02                   1

这可能dplyr吗?我看了看,lag但是在这种情况下,固定的滞后大小没有意义。也许还有另一个包装?

阿克伦

一种选择是duplicated从数据集中删除所有“ id”

df %>%
  filter(!(duplicated(ids)|duplicated(ids, fromLast=TRUE)))
#        date ids
#1 2016-01-01   2
#2 2016-01-02   3

更新

使用更新的数据

df %>%
    arrange(date, ids) %>% 
    filter(!duplicated(ids)) %>% 
    group_by(date) %>% 
    summarise(n_unique_ids = n())
 #       date n_unique_ids
 #      <date>        <int>
 #1 2016-01-01            2
 #2 2016-01-02            1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

dplyr中的滑动组

来自分类Dev

dplyr中的重叠组

来自分类Dev

dplyr中每个组的r累积

来自分类Dev

在dplyr,R中不带组的样本

来自分类Dev

在dplyr,R中不带组的样本

来自分类Dev

选择组取决于dplyr中两列中的值

来自分类Dev

如何在dplyr中引用组中的行数?

来自分类Dev

如何在引导折叠中也滑动到嵌套面板组的面板标题顶部

来自分类Dev

根据dplyr中的percent_rank创建组

来自分类Dev

由于dplyr中组之间的条件而添加新列

来自分类Dev

使用R中的dplyr建立组之间的差异

来自分类Dev

使用dplyr在R中按组计算统计检验

来自分类Dev

相对于每个组中的值的比例(通过dplyr)

来自分类Dev

获取每行的值以及dplyr中组的值

来自分类Dev

使用dplyr mutate查找值在组中的首次出现

来自分类Dev

在R和dplyr中按组落后/领先

来自分类Dev

dplyr:将抖动添加到组中的重复值

来自分类Dev

如何在dplyr中按组删除前n行

来自分类Dev

组中每一行的Dplyr时差

来自分类Dev

使用dplyr在特定组中按变量拆分

来自分类Dev

在dplyr中,如何仅对符合条件的某些组执行操作?

来自分类Dev

使用dplyr根据列表中项目的比例选择组

来自分类Dev

按组计算dplyr中具有先前值的字段

来自分类Dev

计算dplyr中组比例的置信区间

来自分类Dev

使用dplyr在R中按组计算统计检验

来自分类Dev

dplyr样式计数(如果按r中的组)

来自分类Dev

使用R中的dplyr建立组之间的差异

来自分类Dev

使用dplyr处理组中的每一行

来自分类Dev

获取每行的值以及dplyr中组的值