如果所有列均包含NA,但在行中删除NA值,但保留至少包含一个结果的行

用户名

我有一些数据,我正在尝试从中删除NA值。

我应用以下内容:

data %>% 
  head(20) %>% 
  drop_na(contains("gvkey"))

删除所有行。我想保留第12和16行,因为这两行在其中一列中都有值gvkey[X]如果有问题,gvkey2我也想保留这些行。同样适用于gvkey[1]...[5]

数据:

data <- structure(list(cod = structure(c(12L, 2L, 3L, 3L, 3L, 2L, 2L, 
3L, 3L, 3L, 2L, 3L, 2L, 2L, 3L, 3L, 2L, 5L, 5L, 2L), .Label = c("01 Unassigned", 
"02 US corporation", "03 Foreign corp, incl. state-owned", "04 US individual", 
"05 Foreign individual", "06 US government", "07 Foreign government", 
"08 US local government", "09 US state government", "US university", 
"Foreign university", "US institute", "Foreign institute", "US hospital/med inst", 
"Foreign hospital/med inst"), class = "factor"), cod_fix = c(32L, 
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 
0L, 0L, 0L), pdpass = c(12832332L, 11624193L, 12549858L, 11170486L, 
10513915L, 13143949L, 10817896L, 12517845L, 13028479L, 12986393L, 
11719402L, 12298245L, 12249804L, 12898008L, 13100249L, 12298245L, 
10256638L, -19842L, -19842L, 11485267L), standard_name = c("& AEROSPACE FOUND", 
"& COMMUNICATIONS", "& DESIGN LTD", "& FR", "& SA FAB DEBAUCHES", 
"& SON INC", "& YET INC", "&&T TECH CO LTD", "01 COMMUNIQUE LAB INC", 
"01 DB METRAVIB", "02 MICRO INC", "02 MICRO INT LTD", "02 TECH INC", 
"02IC INC", "02MICRO", "02MICRO INT LTD", "03 CO", "080 STUDIO INC", 
"0KAMOTO ; SHOSUKE", "1"), uspto_assignee = c(835951L, 721167L, 
806186L, 182855L, 182585L, NA, 30140L, 802588L, NA, NA, 729315L, 
782400L, 775728L, 825676L, NA, 782400L, 641605L, NA, NA, 708378L
), pdpco1 = c(NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 138961L, 
NA, NA, NA, 138961L, NA, NA, NA, NA), source = c(NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, "m2006", NA, NA, NA, "m2006", 
NA, NA, NA, NA), begyr1 = c(NA, NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, 2000L, NA, NA, NA, 2000L, NA, NA, NA, NA), gvkey1 = c(NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 138961L, NA, NA, NA, 
138961L, NA, NA, NA, NA), endyr1 = c(NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, 2006L, NA, NA, NA, 2006L, NA, NA, NA, NA), 
    pdpco2 = c(NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_), begyr2 = c(NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_), gvkey2 = c(NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_), endyr2 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), pdpco3 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), begyr3 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), gvkey3 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), endyr3 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), pdpco4 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), begyr4 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), gvkey4 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), endyr4 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), pdpco5 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), begyr5 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), gvkey5 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_), endyr5 = c(NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_, NA_integer_, 
    NA_integer_, NA_integer_, NA_integer_, NA_integer_)), row.names = c(NA, 
20L), class = "data.frame")
arg0naut91

尝试:

library(dplyr)

data %>%
  filter_at(vars(starts_with('gvkey')), any_vars(!is.na(.)))

输出:

                                 cod cod_fix   pdpass    standard_name uspto_assignee pdpco1 source begyr1 gvkey1
1 03 Foreign corp, incl. state-owned       0 12298245 02 MICRO INT LTD         782400 138961  m2006   2000 138961
2 03 Foreign corp, incl. state-owned       0 12298245  02MICRO INT LTD         782400 138961  m2006   2000 138961
  endyr1 pdpco2 begyr2 gvkey2 endyr2 pdpco3 begyr3 gvkey3 endyr3 pdpco4 begyr4 gvkey4 endyr4 pdpco5 begyr5 gvkey5
1   2006     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA
2   2006     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA     NA
  endyr5
1     NA
2     NA

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如果列中至少有一个特定值,则删除所有行

来自分类Dev

删除R中至少包含一个负值的所有行

来自分类Dev

如果结果包含另一个表中的所有值,则得出结果

来自分类Dev

删除包含列1中ID且在Python数据框中的另一个特定列2上至少具有一个特定值的所有行

来自分类Dev

从六个不同的列中创建一个列,其中一行的所有列均包含一个空值(一个除外)

来自分类Dev

SQL选择并显示包含至少一个值的组中的所有值

来自分类Dev

lm.wfit(x, y, w, offset = offset, single.ok = single.ok, : 0 (non-NA) 情况下的错误。但所有列都包含至少一个非 NA 值

来自分类Dev

R:如果一个值为NA,则将所有行值设为NA

来自分类Dev

删除CSV中包含一个重复值的连续行,但保留最后一行

来自分类Dev

如果选择的列中的所有值返回NA作为结果,则删除数据框中的行

来自分类Dev

过滤两列:如果第二列中存在值,则保留与一个ID关联的所有行

来自分类Dev

删除每列中包含NA的行

来自分类Dev

如果至少一个单元格满足给定条件(例如,缺少值),则删除所有id行

来自分类Dev

如何获得至少包含另一个列表的所有值的列表?

来自分类Dev

如何从字典列表中删除或消除所有包含一个列表值的字典?

来自分类Dev

如何选择行中至少一个元素中包含特定值的行?

来自分类Dev

如何选择行中至少一个元素中包含特定值的行?

来自分类Dev

所有有效的电子邮件中是否至少包含一个@符号?

来自分类Dev

从列中获取最大值,并提取至少包含该值20%的所有行

来自分类Dev

Excel如果一列包含唯一值,而另一列包含一个真值,则返回这些唯一值的所有真值

来自分类Dev

删除R中包含一个空白列的行

来自分类Dev

如何在一个包含NA的data.frame中合并列以删除NA

来自分类Dev

如果R中的另一个列中未包含该值,则删除该值

来自分类Dev

如果R中的另一个列中未包含该值,则删除该值

来自分类Dev

返回所有行,其中任一列中至少有一个值为null

来自分类Dev

如果一个中的所有单词都包含在另一列中,则匹配两列

来自分类Dev

删除当月内所有NA值均出现的月份中的所有值

来自分类Dev

如果一个数组包含使用BigQuery的另一数组中的所有值,该如何过滤行?

来自分类Dev

删除所有列值也是 NA 的 NA 行

Related 相关文章

  1. 1

    如果列中至少有一个特定值,则删除所有行

  2. 2

    删除R中至少包含一个负值的所有行

  3. 3

    如果结果包含另一个表中的所有值,则得出结果

  4. 4

    删除包含列1中ID且在Python数据框中的另一个特定列2上至少具有一个特定值的所有行

  5. 5

    从六个不同的列中创建一个列,其中一行的所有列均包含一个空值(一个除外)

  6. 6

    SQL选择并显示包含至少一个值的组中的所有值

  7. 7

    lm.wfit(x, y, w, offset = offset, single.ok = single.ok, : 0 (non-NA) 情况下的错误。但所有列都包含至少一个非 NA 值

  8. 8

    R:如果一个值为NA,则将所有行值设为NA

  9. 9

    删除CSV中包含一个重复值的连续行,但保留最后一行

  10. 10

    如果选择的列中的所有值返回NA作为结果,则删除数据框中的行

  11. 11

    过滤两列:如果第二列中存在值,则保留与一个ID关联的所有行

  12. 12

    删除每列中包含NA的行

  13. 13

    如果至少一个单元格满足给定条件(例如,缺少值),则删除所有id行

  14. 14

    如何获得至少包含另一个列表的所有值的列表?

  15. 15

    如何从字典列表中删除或消除所有包含一个列表值的字典?

  16. 16

    如何选择行中至少一个元素中包含特定值的行?

  17. 17

    如何选择行中至少一个元素中包含特定值的行?

  18. 18

    所有有效的电子邮件中是否至少包含一个@符号?

  19. 19

    从列中获取最大值,并提取至少包含该值20%的所有行

  20. 20

    Excel如果一列包含唯一值,而另一列包含一个真值,则返回这些唯一值的所有真值

  21. 21

    删除R中包含一个空白列的行

  22. 22

    如何在一个包含NA的data.frame中合并列以删除NA

  23. 23

    如果R中的另一个列中未包含该值,则删除该值

  24. 24

    如果R中的另一个列中未包含该值,则删除该值

  25. 25

    返回所有行,其中任一列中至少有一个值为null

  26. 26

    如果一个中的所有单词都包含在另一列中,则匹配两列

  27. 27

    删除当月内所有NA值均出现的月份中的所有值

  28. 28

    如果一个数组包含使用BigQuery的另一数组中的所有值,该如何过滤行?

  29. 29

    删除所有列值也是 NA 的 NA 行

热门标签

归档