使用过滤器将数据框应用于不同变量

Jakob 发表于 Dev

雅各布

我正在尝试在数据框中计算几个新变量。以初始值为例：

说我有：

Dataset <- data.frame(time=rep(c(1990:1992),2),
           geo=c(rep("AT",3),rep("DE",3)),var1=c(1:6), var2=c(7:12))

        time    geo var1 var2
1       1990    AT  1    7
2       1991    AT  2    8
3       1992    AT  3    9
4       1990    DE  4   10
5       1991    DE  5   11
6       1992    DE  6   12

而且我要：

        time    geo  var1  var2  var1_1990  var1_1991  var2_1990 var2_1991
1       1990    AT   1     7      1          2          7         8
2       1991    AT   2     8      1          2          7         8
3       1992    AT   3     9      1          2          7         8
4       1990    DE   4     10     4          5          10        11
5       1991    DE   5     11     4          5          10        11
6       1992    DE   6     12     4          5          10        11

因此，对于新变量，时间和变量都在变化。这是我的尝试：

intitialyears <- c(1990,1991)
intitialvars <- c("var1", "var2") 
# ideally, I want code where I only have to change these two vectors 
# and where it's possible to change their dimensions

for (i in initialyears){
lapply(initialvars,function(x){
rep(Dataset[time==i,x],each=length(unique(Dataset$time)))
})}

它运行没有错误，但没有任何结果。我想在示例中分配变量名称（例如“ var1_1990”），然后立即使新变量成为数据框的一部分。我也想避免for循环，但是我不知道如何在这个函数周围包装两个lapply。我应该让函数使用两个参数吗？Apply函数不能将结果携带到我的环境中吗？我已经在这里停留了一段时间，所以我将不胜感激！

ps：我有解决方案，可以通过组合来实现这种组合，而无需套用和喜欢，但是我想摆脱复制和粘贴：

Dataset$var1_1990 <- c(rep(Dataset$var1[which(Dataset$time==1990)],
                      each=length(unique(Dataset$time))))

bgoldst

这是可以做到的subset()，reshape()和merge()：

merge(Dataset,reshape(subset(Dataset,time%in%c(1990,1991)),dir='w',idvar='geo',sep='_'));
##   geo time var1 var2 var1_1990 var2_1990 var1_1991 var2_1991
## 1  AT 1990    1    7         1         7         2         8
## 2  AT 1991    2    8         1         7         2         8
## 3  AT 1992    3    9         1         7         2         8
## 4  DE 1990    4   10         4        10         5        11
## 5  DE 1991    5   11         4        10         5        11
## 6  DE 1992    6   12         4        10         5        11

列顺序并不完全是您所要解决的问题，但是如果需要，您可以事后使用索引操作来解决。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。