在熊猫数据框的列中按具有不同标识符的重复日期时间索引进行聚合

伊万

我有这种形式的数据框:

         value     identifier
2007-01-01  0.781611      55
2007-01-01  0.766152      56
2007-01-01  0.766152      57
2007-02-01  0.705615      55
2007-02-01  0.032134      56
2007-02-01  0.032134      57
2008-01-01  0.026512      55
2008-01-01  0.993124      56
2008-01-01  0.993124      57
2008-02-01  0.226420      55
2008-02-01  0.033860      56
2008-02-01  0.033860      57

我可以使用此答案按标识符将数据分组

by_date = df.groupby(df.index.date)['value'].mean()
2007-01-01    0.771305
2007-02-01    0.256628
2008-01-01    0.670920
2008-02-01    0.098047

现在,我想按月进行箱线图绘制,因此我可以想象可以对它进行分组:

new_df = pd.DataFrame()
new_df['value'] = by_date
by_month = by_date.groupby(by_date.index.month)
aa = by_month.groupby(lambda x: x.month)
aa.boxplot(subplots=False)

如何在没有虚拟数据框的情况下创建此箱线图?

埃德·楚姆

为了使groupby返回df而不是Series,请使用double替换[[]]

by_date = df.groupby(df.index.date)[['value']].mean()

然后,您可以按月分组并生成箱线图:

by_month = by_date.groupby(by_date.index.month)
by_month.boxplot(subplots=False)

使用双减法是一个微妙的功能,这种功能并不立即显而易见,通常这样做df[col]会返回一个列,但是我们知道传递一个列的列表col_list会返回一个df:df[col_list]在展开时,它与df[[col_a, col_b]]相同,因此得出以下结论:如果执行以下操作,则可以返回df:df[[col_a]]由于我们传递了包含单个元素的列表,因此这与df[col_a]传递标签以执行列索引的位置不同。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在熊猫数据框的列中按具有不同标识符的重复日期时间索引进行聚合

来自分类Dev

按日期对Pandas数据框列索引进行排序

来自分类Dev

熊猫按日期时间对排序的索引进行排序

来自分类Dev

通过熊猫数据框按索引进行移位

来自分类Dev

从具有重复项的列表中对索引进行排序

来自分类Dev

如何从具有不同日期时间索引的另一个数据框中获取列值

来自分类Dev

减去日期时间索引上具有不同粒度的数据框列

来自分类Dev

根据熊猫中其他列的值添加具有唯一标识符的列

来自分类Dev

按列值对数据框中具有相同索引的值进行排序

来自分类Dev

通过装饰器断言熊猫数据框具有日期时间索引

来自分类Dev

具有不相等元素的熊猫日期时间索引数据框之间的操作

来自分类Dev

具有不相等元素的熊猫日期时间索引数据框之间的操作

来自分类Dev

如何使具有重复日期时间索引条目的数据框唯一?

来自分类Dev

r 通过 ddply 从具有两个标识符的数据框中删除异常值

来自分类Dev

熊猫连接数据框列表并有效添加标识符

来自分类Dev

合并具有不同日期时间索引的两个数据框

来自分类Dev

合并具有不同日期时间索引的两个数据框

来自分类Dev

用不同的标识符重复数据帧的行

来自分类Dev

如何按索引对数据框的列进行排名?熊猫

来自分类Dev

R-如何过滤出具有唯一标识符的重复数据?

来自分类Dev

在熊猫数据框中创建日期时间索引

来自分类Dev

如何通过具有不同捆绑标识符的应用程序访问iCloud容器数据?

来自分类Dev

如何通过具有不同捆绑标识符的应用程序访问iCloud容器数据?

来自分类Dev

在R中按日期范围对具有动态日期的数据框进行分组

来自分类Dev

熊猫合并具有不同日期和列的两个数据框

来自分类Dev

合并/合并熊猫中具有不同频率时间序列索引的两个数据帧?

来自分类Dev

在Pandas数据框中按具有不同长度前缀和不一致定界符的列值按公共前缀对数据进行分组和求和

来自分类Dev

连接具有不同日期时间频率的数据框

来自分类Dev

合并具有不同数据类型的列以在熊猫数据框中创建单个dateTime列

Related 相关文章

  1. 1

    在熊猫数据框的列中按具有不同标识符的重复日期时间索引进行聚合

  2. 2

    按日期对Pandas数据框列索引进行排序

  3. 3

    熊猫按日期时间对排序的索引进行排序

  4. 4

    通过熊猫数据框按索引进行移位

  5. 5

    从具有重复项的列表中对索引进行排序

  6. 6

    如何从具有不同日期时间索引的另一个数据框中获取列值

  7. 7

    减去日期时间索引上具有不同粒度的数据框列

  8. 8

    根据熊猫中其他列的值添加具有唯一标识符的列

  9. 9

    按列值对数据框中具有相同索引的值进行排序

  10. 10

    通过装饰器断言熊猫数据框具有日期时间索引

  11. 11

    具有不相等元素的熊猫日期时间索引数据框之间的操作

  12. 12

    具有不相等元素的熊猫日期时间索引数据框之间的操作

  13. 13

    如何使具有重复日期时间索引条目的数据框唯一?

  14. 14

    r 通过 ddply 从具有两个标识符的数据框中删除异常值

  15. 15

    熊猫连接数据框列表并有效添加标识符

  16. 16

    合并具有不同日期时间索引的两个数据框

  17. 17

    合并具有不同日期时间索引的两个数据框

  18. 18

    用不同的标识符重复数据帧的行

  19. 19

    如何按索引对数据框的列进行排名?熊猫

  20. 20

    R-如何过滤出具有唯一标识符的重复数据?

  21. 21

    在熊猫数据框中创建日期时间索引

  22. 22

    如何通过具有不同捆绑标识符的应用程序访问iCloud容器数据?

  23. 23

    如何通过具有不同捆绑标识符的应用程序访问iCloud容器数据?

  24. 24

    在R中按日期范围对具有动态日期的数据框进行分组

  25. 25

    熊猫合并具有不同日期和列的两个数据框

  26. 26

    合并/合并熊猫中具有不同频率时间序列索引的两个数据帧?

  27. 27

    在Pandas数据框中按具有不同长度前缀和不一致定界符的列值按公共前缀对数据进行分组和求和

  28. 28

    连接具有不同日期时间频率的数据框

  29. 29

    合并具有不同数据类型的列以在熊猫数据框中创建单个dateTime列

热门标签

归档