我有以下形式的面板数据:
DT = data.table(Id=1:5, Time1=c(0,0,1,2,0), Time2=c(1,0,0,0,0), Time3=c(0,1,2,0,0), Time4=c(0,1,2,5,4))
Id Time1 Time2 Time3 Time4
1 0 1 0 0
2 0 0 1 1
3 1 0 2 2
4 2 0 0 5
5 0 0 0 4
我想对每个不为0的ID进行首次提取。数据集很大,因此我一直在寻找data.table解决方案。
我尝试了使用which.min(which!= 0)的方法,但是可以解决。
输出应如下所示:
Id Time1 Time2 Time3 Time4 Output
1 0 1 0 0 2
2 0 0 1 1 3
3 1 0 2 2 1
4 2 0 0 5 1
5 0 0 0 4 4
谢谢你的帮助。
你可以做
DT[, Output := which.max(.SD != 0), by = Id][]
# Id Time1 Time2 Time3 Time4 Output
# 1: 1 0 1 0 0 2
# 2: 2 0 0 1 1 3
# 3: 3 1 0 2 2 1
# 4: 4 2 0 0 5 1
# 5: 5 0 0 0 4 4
which.max
查找第一次出现的最大值的索引。因此,当我们这样做时,.SD != 0
它会发现的第一个出现TRUE
。
同样,我们也可以使用
DT[, Output := match(TRUE, .SD != 0), by = Id]
# or
DT[, Output := which(.SD != 0)[1], by = Id]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句