分组并计算pandas / python中的条件值

安德烈·维埃拉·德利马

请在我的python / pandas代码中计算两个带有条件值的独立列。请参阅使用lambda的示例:

self._df = self._df.groupby(['id', 'field1', 'field2'])['fieldX', 'fieldY'].apply(lambda x: pd.Series([(x['fieldX'] == 1).sum(), (x['fieldY'] == 2).sum()])).reset_index()

此代码很慢。还有没有lambda的熊猫和分组方式吗?

谢谢

耶斯列尔

对的,这是可能的。首先DataFrame.assign用于比较两列,将其转换为整数,然后将列分配回原始值,因此最后只需要进行合计sum

self._df = (self._df.assign(fieldX = (self._df['fieldX'] == 1).astype(int),
                            fieldY = (self._df['fieldY'] == 2).astype(int))
                    .groupby(['id', 'field1', 'field2'])['fieldX', 'fieldY']
                    .sum()
                    .reset_index())

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Pandas数据框中计算缺少值的分组数据

来自分类Dev

计算pandas数据框中的共存,以得到按其他列值分组的列值

来自分类Dev

计算MySQL中的分组值

来自分类Dev

计算MySQL中的分组值

来自分类Dev

使用Python + Pandas计算满足其他列中的2个条件的值

来自分类Dev

python中的条件分组

来自分类Dev

按季度平均分组并获取在平均计算中使用的值-pandas

来自分类Dev

使用itertools,正确融合和分组,以使用Pandas对每个属性值计算事件对

来自分类Dev

计算R中连续值的分组比率

来自分类Dev

计算 R 中的分组缺失值

来自分类Dev

Pandas DataFrame 条件分组

来自分类Dev

使用Pandas分组依据数据框中的第一行来计算累积差异

来自分类Dev

使用Pandas分组依据数据框中的第一行来计算累积差异

来自分类Dev

仅根据分组记录计算 Pandas 数据框中的新列

来自分类Dev

计算按列分组的值

来自分类Dev

应用并分组在Pandas python中

来自分类Dev

Pandas Python中的分组处理

来自分类Dev

计算分组中的额外列

来自分类Dev

计算分组中的额外列

来自分类Dev

计算文本中的单词并分组

来自分类Dev

计算Python中数据框的分组元素

来自分类Dev

基于pandas / python中条件的加权平均计算

来自分类Dev

Python Pandas从条件更改值

来自分类Dev

Python Pandas条件值消除

来自分类Dev

在Python Pandas中基于DataFrame中的日期进行值计算?

来自分类Dev

分组值并根据Pandas中的列删除分组的重复项

来自分类Dev

计算不同表中的行并按特定条件分组

来自分类Dev

分组并输出部分列值pandas python

来自分类Dev

分组值并使用Python在Pandas上合并