我有一个pandas数据框,其中包含2013年至2016年的薪资信息。每一行都描述了员工在一年中赚的钱。看起来像这样:
名称,年份,金额
“比尔·史密斯”,“ 2014”,“ $ 20,000”
“约翰·琼斯”,“ 2014”,“ $ 10,000”
“比尔·史密斯”,“ 2015”,“ $ 21,000”
“约翰·琼斯”,“ 2015”,“ 12,000美元”
“ Sam Stone”,“ 2015”,“ $ 15,000”
我需要过滤数据框以选择2014年之后被雇用的工人(例如,Sam Stone,但不是Bill Smith或John Jones)。有什么建议么?我的猜测是使用groupby(),然后尝试使用条件来过滤列表。
这应该工作:
workers = df[df.Year<2015].Name.unique()
mew_workers_data = df[~df.Name.isin(workers)]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句