基于dplyr的多个过滤器操作基于单独列中的观测值的数量和类型

222

我在下面有df,help.a我需要使用多个过滤器操作来清理它。

help.a <- data.frame(id = as.factor(c("01", "01", "01", "01", "01", "04", "04", "05", "05", "05", "05", "05", "09", "09", "09", "09", "09")),
                     episode = c(3, 3, 3, 4, 4, 3, 3, 2, 2, 2, 2, 3, 1, 1, 1, 1, 1),
                     count = c(1, 2, 3, 4, 5, 1, 2, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5),
                     var_a = c(73, 73, 73, 73, 73, 43, 43, 80, 80, 80, 80, 80, 73, 73, 73, 73, 42))


id episode count var_a
01       3     1    73
01       3     2    73
01       3     3    73
01       4     4    73
01       4     5    73
04       3     1    43
04       3     2    43
05       2     1    80
05       2     2    80
05       2     3    80
05       2     4    80
05       3     5    80
09       1     1    73
09       1     2    73
09       1     3    73
09       1     4    73
09       1     5    42

首先:我正在尝试删除计数少于3的所有ID(例如ID 4)

第二:我想删除多个情节的观测值,同时保留第一个观测到的情节(观测到的最低情节数)

第三:我只想保留具有相同var_a变量的id观测值...如果有多个var_a观测值,我只想保留第一个观测变量(例如,id 9和var_a 73)

最后,我希望我的数据集看起来类似于以下内容:

id episode count var_a
01       3     1    73
01       3     2    73
01       3     3    73
05       2     1    80
05       2     2    80
05       2     3    80
05       2     4    80
09       1     1    73
09       1     2    73
09       1     3    73
09       1     4    73

到目前为止,我的尝试已通过以下代码完成了第1部分:

help.a %>% group_by(id) %>% filter(!n() <3)

但是,我坚持如何告诉dplyr保持先观察episode和先观察var.a...任何建议,我们将不胜感激。

阿克伦

filter通过“ id”分组后,我们可以一次使用所有三个条件

 help.a %>% 
     group_by(id) %>% filter(n() >3 & 
                             episode == first(episode) & 
                             var_a == first(var_a))    
 #       id episode count var_a
#    <fctr>   <dbl> <dbl> <dbl>
#1      01       3     1    73
#2      01       3     2    73
#3      01       3     3    73
#4      05       2     1    80
#5      05       2     2    80
#6      05       2     3    80
#7      05       2     4    80
#8      09       1     1    73
#9      09       1     2    73
#10     09       1     3    73
#11     09       1     4    73

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

基于不同列的多个过滤器的pandas df中的列的聚合值-python2.7

来自分类Dev

ggvis过滤器基于多列中的值

来自分类Dev

dplyr过滤器基于列名称查找特定值

来自分类Dev

dplyr过滤器基于列名称查找特定值

来自分类Dev

dplyr中基于有光泽的输入的条件过滤器

来自分类Dev

基于SELECT和输入值的过滤器

来自分类Dev

熊猫使用groupby和基于值的过滤器

来自分类Dev

Django中基于不同过滤器的多个注释

来自分类Dev

基于空列值的Linq过滤器

来自分类Dev

基于过滤器python更新列值

来自分类Dev

基于awk中的字段值的过滤器

来自分类Dev

如何使用PySpark在数据框中删除基于多个过滤器的列?

来自分类Dev

基于检索值的Django过滤器

来自分类Dev

基于过滤器数组的属性值

来自分类Dev

基于过滤器在Pandas DataFrame中创建新列

来自分类Dev

基于angularjs中过滤器的动态列

来自分类Dev

基于angularjs中过滤器的动态列

来自分类Dev

更新基于多表过滤器的列

来自分类Dev

在LibreOffice或其他SpreadSheet工具中应用基于行的过滤器,而不是基于列的过滤器

来自分类Dev

基于列中的两个引用和两个过滤器引用列对Excel中的列求和

来自分类Dev

如何基于多个“或”过滤器过滤查询

来自分类Dev

如何使用带有ng-repeat的过滤器基于字段值过滤和对象

来自分类Dev

汇总基于行的过滤器以进行多种操作

来自分类Dev

在dplyr中应用基于字符串的过滤器矢量(或字符串矢量)

来自分类Dev

基于属性过滤器过滤索引列

来自分类常见问题

Tableau Desktop-基于多个值创建自定义过滤器

来自分类Dev

Tableau Desktop-基于多个值创建自定义过滤器

来自分类Dev

波士顿数据集,基于值的多个过滤器

来自分类Dev

在 hbase 中添加多个列键和值过滤器

Related 相关文章

  1. 1

    基于不同列的多个过滤器的pandas df中的列的聚合值-python2.7

  2. 2

    ggvis过滤器基于多列中的值

  3. 3

    dplyr过滤器基于列名称查找特定值

  4. 4

    dplyr过滤器基于列名称查找特定值

  5. 5

    dplyr中基于有光泽的输入的条件过滤器

  6. 6

    基于SELECT和输入值的过滤器

  7. 7

    熊猫使用groupby和基于值的过滤器

  8. 8

    Django中基于不同过滤器的多个注释

  9. 9

    基于空列值的Linq过滤器

  10. 10

    基于过滤器python更新列值

  11. 11

    基于awk中的字段值的过滤器

  12. 12

    如何使用PySpark在数据框中删除基于多个过滤器的列?

  13. 13

    基于检索值的Django过滤器

  14. 14

    基于过滤器数组的属性值

  15. 15

    基于过滤器在Pandas DataFrame中创建新列

  16. 16

    基于angularjs中过滤器的动态列

  17. 17

    基于angularjs中过滤器的动态列

  18. 18

    更新基于多表过滤器的列

  19. 19

    在LibreOffice或其他SpreadSheet工具中应用基于行的过滤器,而不是基于列的过滤器

  20. 20

    基于列中的两个引用和两个过滤器引用列对Excel中的列求和

  21. 21

    如何基于多个“或”过滤器过滤查询

  22. 22

    如何使用带有ng-repeat的过滤器基于字段值过滤和对象

  23. 23

    汇总基于行的过滤器以进行多种操作

  24. 24

    在dplyr中应用基于字符串的过滤器矢量(或字符串矢量)

  25. 25

    基于属性过滤器过滤索引列

  26. 26

    Tableau Desktop-基于多个值创建自定义过滤器

  27. 27

    Tableau Desktop-基于多个值创建自定义过滤器

  28. 28

    波士顿数据集,基于值的多个过滤器

  29. 29

    在 hbase 中添加多个列键和值过滤器

热门标签

归档