我正在尝试通过过滤出出现次数最多的5个国家/地区的行并将其保存到新的数据框中来创建新的数据框。
我尝试使用.nlargest,但不适用于分类数据。
谢谢。
数据框示例
用途Series.value_counts-它返回按Series计数排序的结果,因此对于最大值,index通过索引过滤值并传递给boolean indexingwith Series.isin:
Series.value_counts
Series
index
boolean indexing
Series.isin
top5 = df['Country'].value_counts().index[:5] df1 = df[df['Country'].isin(top5)]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
点击生成二维码
我来说两句