请在下面查看我正在使用的数据集:
index d1_t1 d1_t2 d1_t3 d1_t4 d2_t1 d2_t2 d2_t3 d2_t4 d3_t1 d3_t2 d3_t3 d3_t4 d4_t1 d4_t2 d4_t3 d4_t4 d5_t1 d5_t2 d5_t3 d5_t4 d6_t1 d6_t2 d6_t3 d6_t4
101 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
200 1 1 1 1 1 1 0 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 0
200 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
101 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
d7_t1 d7_t2 d7_t3 d7_t4
1 1 1 1
1 1 0 0
1 1 1 1
1 1 1 1
变量的简短说明:
d1t1=Day 1 time 1
d1t2=Day 1 time 2
....
d2t1=Day2 time 1
d2t2=Day2 time 2
0,1 =在特定时间进行的不同类型的测量
我想确定一周内测量结果相似的系列
输出:
index d1_t1 d1_t2 d1_t3 d1_t4 d2_t1 d2_t2 d2_t3 d2_t4 d3_t1 d3_t2 d3_t3 d3_t4 d4_t1 d4_t2 d4_t3 d4_t4 d5_t1 d5_t2 d5_t3 d5_t4 d6_t1 d6_t2 d6_t3 d6_t4 d7_t1 d7_t2 d7_t3 d7_t4
1 101 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
样本数据:
df<-structure(list(index=c (101,200,200,101), d1_t1 = c(1, 1, 1, 1),
d1_t2 = c(1, 1, 1, 1),
d1_t3 = c(1, 1, 1, 1),
d1_t4 = c(1, 1, 0, 1),
d2_t1 = c(1, 1, 1, 1),
d2_t2 = c(1, 1, 1, 1),
d2_t3 = c(1, 0, 1 ,1),
d2_t4 =c(1,0,1,1),
d3_t1 = c(1, 1, 1, 1),
d3_t2 = c(1, 1, 1, 1),
d3_t3 = c(1, 1, 1, 1),
d3_t4 = c(1, 0, 1, 1),
d4_t1 = c(1, 1, 1, 1),
d4_t2 = c(1, 1, 1, 1),
d4_t3 = c(1, 1, 1 ,1),
d4_t4 =c(1,1,1,1),
d5_t1 = c(1, 1, 1, 1),
d5_t2 = c(1, 1, 1, 1),
d5_t3 = c(1, 1, 1, 1),
d5_t4 = c(1, 1, 1, 1),
d6_t1 = c(1, 1, 1, 1),
d6_t2 = c(1, 1, 1, 1),
d6_t3 = c(1, 0, 1 ,1),
d6_t4 =c(1,0,1,1),
d7_t1 = c(1, 1, 1, 1),
d7_t2 = c(1, 1, 1, 1),
d7_t3 = c(1, 0, 1 ,1),
d7_t4 =c(1,0,1,1)), row.names = c(NA,4L), class = "data.frame")
df
一种dplyr
选择是:
df %>%
group_by_all() %>%
filter(n() > 1 & row_number() == 1)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句