熊猫过滤分组数据并汇总

debugcn 发表于 Dev

用户名

我想将数据分组DataFrame，将每组中的异常值过滤掉（例如分位数（0.95）），然后汇总每组的结果。

我试图这样做：

import pandas as pd
import numpy as np

dff = pd.DataFrame({"A": np.arange(8), "B": list("aabbbbcc")})
group = dff.groupby(["B"])
print(group.mean())
group1 = group.apply(lambda g: g[g["A"] < g["A"].quantile(0.95)])

print("-------")
print(group1.mean())

然而，这似乎并没有做正确的事，因为group1对象其实不是DataFrameGroupBy因为是group对象。我找不到任何返回过滤DataFrameGroupBy对象的函数

乔希

这可以通过再次在“ B”上分组来完成。请注意，要执行此操作，将需要重置索引（drop = True以避免重复数据帧中的“ B”），否则该groupby函数将产生错误，指出“ B”既是索引级别又是列标签。尝试替换group1.mean()为：

group1.reset_index(drop=True).groupby("B").mean()

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-6

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何过滤熊猫数据框，然后进行分组和汇总值列表？

来自分类Dev

汇总Google图表中的分组/过滤数据

来自分类Dev

熊猫分组汇总

来自分类Dev

熊猫的分组和汇总

来自分类Dev

汇总熊猫中的一组分组数据

来自分类Dev

通过汇总两列来过滤熊猫数据框

来自分类Dev

熊猫汇总分组和汇总

来自分类Dev

熊猫分组并汇总多个列表

来自分类Dev

熊猫过滤和分组

来自分类Dev

熊猫分组条件过滤

来自分类Dev

熊猫按2列的条件按汇总数据框分组

来自分类Dev

sql server汇总或分组数据

来自分类Dev

当组来自MultiIndex级别时，按列汇总过滤分组的Pandas数据

来自分类Dev

分组数据的分组依据（熊猫）

来自分类Dev

如何在熊猫中汇总和分组

来自分类Dev

熊猫分组时间和ID汇总

来自分类Dev

熊猫多重分组和过滤

来自分类Dev

熊猫中的数据分组

来自分类Dev

熊猫数据框过滤

来自分类Dev

熊猫按年份分组按n个最大值过滤数据框

来自分类Dev

分组并根据熊猫数据框中的其他列比较/过滤特定组

来自分类Dev

具有不规则时间序列的分组后的熊猫数据帧过滤

来自分类Dev

分组和汇总查询数据表

来自分类Dev

如何汇总和分组对象数据？

来自分类Dev

使用Python分组并汇总数据集

来自分类Dev

数据透视表中重叠分组的汇总

来自分类Dev

分组后的数据分组可媲美熊猫

来自分类Dev

通过X列中的最小正值计数（按Y列中的值汇总）过滤熊猫数据集

来自分类Dev

熊猫-分组和过滤连续值

Related 相关文章

文章