我有一个数据框,由
Lancaster001A 76
Lancaster001B 35
Lancaster002A 46
Lancaster002D 9
.... ...
我想将数据框合并到此
Lancaster001 111
Lancaster002 55
因此,删除较小的分类。我找不到与合并相关的方法,是否可以使用相似性使用一般功能?
这是使用正则表达式删除三个数字字符之后的所有字符的基本R解决方案:
DF <- read.table(text = "Lancaster001A 76
Lancaster001B 35
Lancaster002A 46
Lancaster002D 9")
setNames(aggregate(V2 ~ gsub("(?<=\\d{3}).*", "", V1, perl = TRUE),
DF, FUN = sum),
c("V1", "V2"))
# V1 V2
#1 Lancaster001 111
#2 Lancaster002 55
如果在大型数据集上的聚合速度太慢,则使用data.table将是微不足道的。
如果数据结构不同,请根据需要调整正则表达式。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句