如何使函数使用一个或多个值对(x1,y1; x2,y2; ...根据需要)来对数据帧进行子集化
selection <- function(x1,y1, ...){
dfselected <- subset(df, V1 == "x1" & V2 == "y1"
## MAY OR MAY NOT BE PRESENT ##
| V1 == "x2" & V2 == "y2")
return(dfselected)
}
我可以subset()
为单个索引执行此操作。例:
df <- data.frame(
V1 = c(rep("a",5), rep("b",5)),
V2 = rep(c(1:5),2),
V3 = c(101:110)
)
即
V1 V2 V3
a 1 101
a 2 102
a 3 103
a 4 104
a 5 105
b 1 106
b 2 107
b 3 108
b 4 109
b 5 110
夫妻(“ a”,“ 3”)和(“ b”,“ 4”)的子集看起来像
dfselected <- subset(df, V1 == "a" & V2 == 3 | V1 == "b" & V2 == 4 )
我找不到类似的功能。我不知道是否必须将未指定数量的参数传递给函数(所谓的“三个点”)或使用if/else
。我是函数的初学者,因此也欢迎链接或示例。我主要从以下内容开始:http://www.ats.ucla.edu/stat/r/library/intro_function.htm
------------------------------哈德利回答后的解决方案
selection <- function (x,y){
match <- data.frame(
V1 = x,
V2 = y,
stringsAsFactors = FALSE
)
return(dplyr::semi_join(df, match))
}
听起来像您想要一个半联接:在x中查找在y中具有匹配条目的所有行:
df <- data.frame(
V1 = c(rep("a",5), rep("b",5)),
V2 = rep(c(1:5), 2),
V3 = c(101:110),
stringsAsFactors = FALSE
)
match <- data.frame(
V1 = c("a", "b"),
V2 = c(3L, 4L),
stringsAsFactors = FALSE
)
library(dplyr)
semi_join(df, match)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句