我有一个具有如下所示结构的数据集。
dat <- data.frame(
event = c("A", "A", "A", "B", "B", "B", "B", "C", "C", "C"),
place =c("p1", "p1", "p2", "p3", "p3", "p3", "p4","p4","p4", "p5"),
day = c("May 1","May 2","May 3", "May 4", "May 5", "May 6", "May 7", "May 8",
"May 9", "May 1"),
visits = c(2,1,4,1,2,4,8,2,3,1))
我想为每个事件确定在2天(或至少2天)内访问量最高的地方。
结果我想要:
event place visits
A p1 3
B p3 7
C p4 5
进行此操作的另一种方法是,首先为每个组添加计数,选择计数大于1的组,然后选择event
最大值visits
。
library(dplyr)
dat %>%
add_count(event, place) %>%
filter(n > 1) %>%
group_by(event, place) %>%
summarise(n = sum(visits)) %>%
slice(which.max(n))
# event place n
# <fct> <fct> <dbl>
#1 A p1 3
#2 B p3 7
#3 C p4 5
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句