我希望能够为dplyr
动词定义参数
condition <- "dist > 50"
然后在dplyr
函数中使用这些字符串:
require(ggplot2)
ds <- cars
ds1 <- ds %>%
filter (eval(condition))
ds1
但这会引发错误
Error: filter condition does not evaluate to a logical vector.
该代码应评估为:
ds1<- ds %>%
filter(dist > 50)
ds1
导致 :
ds1
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
5 18 76
6 18 84
7 19 68
8 20 52
9 20 56
10 20 64
11 22 66
12 23 54
13 24 70
14 24 92
15 24 93
16 24 120
17 25 85
如何将字符串作为dplyr
动词的参数传递?
自2014年以来,使用rlang的准引号可能有两种新方法。
常规的硬编码过滤器语句。为了便于比较,该语句dist > 50
直接包含在中dplyr::filter()
。
library(magrittr)
# The filter statement is hard-coded inside the function.
cars_subset_0 <- function( ) {
cars %>%
dplyr::filter(dist > 50)
}
cars_subset_0()
结果:
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
...
17 25 85
NSE的rlang方法(非标准评估)。如使用dplyr小插图编程中所述,该语句dist > 50
由处理rlang::enquo()
,“使用某种黑魔法查看参数,查看用户键入的内容,并将该值作为确定值返回”。然后,rlang!!
取消对输入的引用,以便“在周围的上下文中立即对其进行评估”。
# The filter statement is evaluated with NSE.
cars_subset_1 <- function( filter_statement ) {
filter_statement_en <- rlang::enquo(filter_statement)
message("filter statement: `", filter_statement_en, "`.")
cars %>%
dplyr::filter(!!filter_statement_en)
}
cars_subset_1(dist > 50)
结果:
filter statement: `~dist > 50`.
<quosure>
expr: ^dist > 50
env: global
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
17 25 85
rlang方法传递字符串。该语句"dist > 50"
作为显式字符串传递给函数,并由解析为表达式rlang::parse_expr()
,然后由取消引用!!
。
# The filter statement is passed a string.
cars_subset_2 <- function( filter_statement ) {
filter_statement_expr <- rlang::parse_expr(filter_statement)
message("filter statement: `", filter_statement_expr, "`.")
cars %>%
dplyr::filter(!!filter_statement_expr)
}
cars_subset_2("dist > 50")
结果:
filter statement: `>dist50`.
speed dist
1 14 60
2 14 80
3 15 54
4 18 56
...
17 25 85
使用,事情变得更简单dplyr::select()
。显式字符串只需要!!
。
# The select statement is passed a string.
cars_subset_2b <- function( select_statement ) {
cars %>%
dplyr::select(!!select_statement)
}
cars_subset_2b("dist")
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句