我有下面的数据框,恰好是NBA选秀数据:
draft_year draft_round teamid playerid draft_from
1961 1 Bos Pol1 Nan
2001 1 LA Ben2 Cal
1967 2 Min Mac2 Nan
2001 1 LA Ben2 Cal
2000 1 C Sio1 Bud
2000 1 C Gio1 Bud
我只想查找和删除那些在playerid中重复的行。出于明显的原因,其余重复项具有有意义的目的,必须保留。
在data.table
包by
中,unique
函数中有一个参数
library(data.table)
unique(setDT(df), by = "playerid")
# draft_year draft_round teamid playerid draft_from
# 1: 1961 1 Bos Pol1 Nan
# 2: 2001 1 LA Ben2 Cal
# 3: 1967 2 Min Mac2 Nan
# 4: 2000 1 C Sio1 Bud
# 5: 2000 1 C Gio1 Bud
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句