考虑以下数据集
为什么这样做时会得到不同的结果:
library(dplyr)
df %>%
filter(!(w >= 1 | lag(w >= 1, default = F))) %>%
filter(lag(t, default = T) != t) %>%
summarise(median = median(r), mad = mad(r))
结果是:
median mad
1 664 142.3296
和
df %>%
filter(!(w >= 1 | lag(w >= 1, default = F)),
lag(t, default = T) != t) %>%
summarise(median = median(r), mad = mad(r))
这使:
median mad
1 671 152.7078
请参阅上面的评论以及:http : //cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html
filter()
允许您选择数据框行的子集。
...
filter()
的工作方式subset()
与之相似,不同之处在于您可以给它提供任意数量的过滤条件,并且可以将它们结合在一起&
(&&
这不容易做到!)。您可以显式使用其他布尔运算符:filter(flights, month == 1 | month == 2)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句