我对R相对较新,试图基于其他列获取列的总和。我的数据帧如下
YEAR EventID LOSS
1 554 334740
1 415 149816
1 207 199446
2 961 527042
3 614 188199
4 968 87044
4 650 75377
4 341 424678
4 397 210730
5 610 368068
在这里,我的条件是,每年我需要最高损失的总和。
损失数:从1年级开始的EVENTID 554,从2年级开始的EVENTID 961,从4年级开始的EVENTID 341,从5年级开始的EVENTID 610。
这是一个简单的方法dplyr
:
d %>%
group_by(YEAR) %>%
summarize(EventID = EventID[1],
max_loss = max(LOSS))
您还可以多次发生具有相同最大损失的事件,然后需要合并回原始数据集并进行过滤:
d %>%
group_by(YEAR) %>%
summarize(max_loss = max(LOSS)) %>%
left_join(d, .) %>%
filter(LOSS == max_loss)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句