如何在熊猫中执行诸如groupby（）和value_counts（）之类的某些操作？

o0Helloworld0o 发表于 Dev

o0Helloworld0o

这是一个熊猫数据框，定义如下：

df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo', 'foo'],
                   'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three', 'two'],
                   'C' : [0, 1, 0, 1, 1, 2, 0, 2, 1]})
>>> df
     A      B  C
0  foo    one  0
1  bar    one  1
2  foo    two  0
3  bar  three  1
4  foo    two  1
5  bar    two  2
6  foo    one  0
7  foo  three  2
8  foo    two  1

我想做两个操作。

首先，将Dataframe按列A和分组B。因此，在这种情况下，获得了6个组。此操作类似于pandas中的groupby（）函数。

然后，对于每个组，对列进行计数操作，C因为在这种情况下，它可以是三个不同的值（0、1和2）。此操作类似于pandas中的value_counts（）函数。

最后，我想要一个这样的新数据框。

     A      B  C_value0  C_value1  C_value2
0  foo    one         2         0         0
1  foo    two         1         2         0
2  foo  three         0         0         1
3  bar    one         0         1         0
4  bar    two         0         0         1
5  bar  three         0         1         0

有人可以告诉我如何实现这一目标吗？谢谢！

耶斯列尔

您可以使用groupby与聚合size，然后更换NaN到0通过fillna，转换到int通过astype，add_prefix，reset_index和最后一个rename_axis（新的pandas 0.18.0）：

print (df.groupby(['A','B', 'C'])['C'].size()
                                      .unstack()
                                      .fillna(0)
                                      .astype(int)
                                      .add_prefix('C_value')
                                      .reset_index()
                                      .rename_axis(None, axis=1))

     A      B  C_value0  C_value1  C_value2
0  bar    one         0         1         0
1  bar  three         0         1         0
2  bar    two         0         0         1
3  foo    one         2         0         0
4  foo  three         0         0         1
5  foo    two         1         2         0

另一个解决方案crosstab：

print (pd.crosstab([df.A, df.B], df.C)
         .add_prefix('C_value') 
         .reset_index()
         .rename_axis(None, axis=1))

     A      B  C_value0  C_value1  C_value2
0  bar    one         0         1         0
1  bar  three         0         1         0
2  bar    two         0         0         1
3  foo    one         2         0         0
4  foo  three         0         0         1
5  foo    two         1         2         0

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。