在R中使用grep和子集的多重过滤

Andrew Fang 发表于 Dev

方安德

我正在尝试创建一个过滤器，以使用grep和子集一起从数据集中删除行。

样本数据集：

id <- 1:10
problem <- c("a" , "b", "c", "d", "a","b","c","a", "b", "a")
solution1 <- c("eat", "sleep", "drink", "play", "sleep", "play", "play", "drink", "play", "eat")
solution2 <- c("read", "read", "eat", "drink", "eat", "sleep", "eat", "read", "eat", "play")
df <- c(id, problem, solution1, solution2)

我正在尝试删除问题为“ a”的行，并在solution1或solution2中都包含“ eat”。

结果是应删除ID 1、5和10。

我试过使用：

df <- subset(df, problem=="a" & !(grepl("eat", df)))

和

df <- df[!grepl("eat", df) & grepl("a", df$problem)]

在StackOverflow或我用Google搜索的其他网站上似乎找不到类似的解决方案。

如果有人可以帮助，将不胜感激。谢谢！

多米尼克·科托伊斯

首先，如果要使用数据框，则应使用data.frame而不是c：

df <- data.frame(id, problem, solution1, solution2)

然后，您可以例如这样子集（本身无需使用子集）

df2 <- df[!(grepl("a", df$problem) & 
           (grepl("eat", df$solution1) |
            grepl("eat", solution2))),]

#   id problem solution1 solution2
# 2  2       b     sleep      read
# 3  3       c     drink       eat
# 4  4       d      play     drink
# 6  6       b      play     sleep
# 7  7       c      play       eat
# 8  8       a     drink      read
# 9  9       b      play       eat

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。