df =
Name Age City
Jack 34 Sydney
Riti 30 Delhi
Aadi 16 New York
Riti 30 Delhi
Riti 30 Delhi
Riti 30 Mumbai
Aadi 40 London
Sachin 30 Delhi
df[df.duplicated(keep='last')]
上面的代码给出了重复列表。但是我需要的是如果df
包含至少1个重复项,则它应该返回The df contains duplicate rows
。
您可以使用any
:
>>> df
Name Age City
0 Jack 34 Sydney
1 Riti 30 Delhi
2 Aadi 16 NewYork
3 Riti 30 Delhi
4 Riti 30 Delhi
5 Riti 30 Mumbai
6 Aadi 40 London
7 Sachin 30 Delhi
>>> df.duplicated().any()
True
>>> 'The df contains duplicates' if df.duplicated().any() else 'no duplicates'
'The df contains duplicates'
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句