使用GroupBy按时数据对数据框进行重新采样

马克·K

每秒的交通数据显示进出的汽车数量。我想按In / Out将它们汇总到2分钟内,并显示其总计,例如:

在此处输入图片说明

import pandas as pd

data = {'time': ["13:34:16","13:34:19","13:34:52","13:34:55","13:34:58","13:35:01","13:35:04","13:35:37","13:35:40","13:35:43","13:36:37","13:36:39","13:36:43","13:36:46","13:36:49","13:36:52","13:36:58","13:37:04","13:37:07","13:37:13","13:37:46","13:37:49","13:37:58",], 
'cars' : [15,22,12,1,331,32,14,5,51,13,3,22,5,2,4,1,3,5,89,105,1,63,1,],
'flow': ["In","Out","In","Unknown","Out","In","Out","Unknown","Out","Out","In","In","Unknown","In","In","Out","In","In","In","In","In","In","In",]}

我试过了:

df = pd.DataFrame(data)
df.time = '2020-01-23 ' + df.time     # data date

df.time = pd.to_datetime(df.time, unit='s')

print (df.groupby('flow').resample('2T')['cars'].sum())

但是它给出了错误:

ValueError: non convertible value 2020-01-23 13:34:16 with the unit 's'

在正确的方法上有什么帮助吗?谢谢。

谢尔盖·布什曼诺夫(Sergey Bushmanov)

我相信您应该对索引重新采样。你能试一下吗:

df.time = pd.to_datetime(df.time)
df.set_index("time").groupby('flow').resample('2T')['cars'].sum()
flow     time               
In       2020-01-23 13:34:00     59
         2020-01-23 13:36:00    298
Out      2020-01-23 13:34:00    431
         2020-01-23 13:36:00      1
Unknown  2020-01-23 13:34:00      6
         2020-01-23 13:36:00      5
Name: cars, dtype: int64

还有,如果您想复制自己的excel:

df_new = df_new.unstack().T
df_new["Total"] =df_new.sum(axis=1)
print(df_new)
flow                  In  Out  Unknown  Total
time                                         
2020-01-23 13:34:00   59  431        6    496
2020-01-23 13:36:00  298    1        5    304

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何按时段对熊猫数据框进行重新采样?

来自分类Dev

如何使用groupby或重新采样以根据python中年份的小时索引将小时数据下采样以分组数据?

来自分类Dev

使用 asfreq 对 Pandas 数据框重新采样

来自分类Dev

如何对数据框进行二次采样?

来自分类Dev

如何使用熊猫数据框以秒为单位对累积数据进行重新采样并每天重置

来自分类Dev

使用 Pandas 对数据帧的特定周期进行下采样

来自分类Dev

每月对数据重新采样R或Python

来自分类Dev

使用小时作为中点,重新采样到熊猫数据框以每小时进行一次

来自分类Dev

在GroupBy之后根据特定列对数据框进行排序

来自分类Dev

在R中逐行对数据框的列进行重新排序

来自分类Dev

在R中逐行对数据框的列进行重新排序

来自分类Dev

根据列均值对数据框的列进行重新排序

来自分类Dev

R:对数据框中的行进行重新排序

来自分类Dev

如何对数据帧进行重采样

来自分类Dev

熊猫数据框:使用线性插值重新采样

来自分类Dev

使用python重新采样数据框时出错

来自分类Dev

熊猫groupby重新采样导致数据丢失

来自分类Dev

按组对数据框的子集进行采样,样本大小等于数据框的另一个子集

来自分类Dev

重新采样熊猫数据框并计数实例

来自分类Dev

用熊猫重新采样“整洁”的数据框

来自分类Dev

用系数重新采样熊猫数据框

来自分类Dev

熊猫数据框重新采样而不聚合

来自分类Dev

用熊猫重新采样“整洁”的数据框

来自分类Dev

重新采样 Pandas 数据框无效

来自分类Dev

Flutter + Firebase。按时间顺序对数据进行排序

来自分类Dev

按时间间隔和条件对数据进行分组

来自分类Dev

R使用变量对数据框进行排序/排序

来自分类Dev

使用python对数据框中的每个项目进行排序

来自分类Dev

在Python中使用列总和对数据框进行子集

Related 相关文章

  1. 1

    如何按时段对熊猫数据框进行重新采样?

  2. 2

    如何使用groupby或重新采样以根据python中年份的小时索引将小时数据下采样以分组数据?

  3. 3

    使用 asfreq 对 Pandas 数据框重新采样

  4. 4

    如何对数据框进行二次采样?

  5. 5

    如何使用熊猫数据框以秒为单位对累积数据进行重新采样并每天重置

  6. 6

    使用 Pandas 对数据帧的特定周期进行下采样

  7. 7

    每月对数据重新采样R或Python

  8. 8

    使用小时作为中点,重新采样到熊猫数据框以每小时进行一次

  9. 9

    在GroupBy之后根据特定列对数据框进行排序

  10. 10

    在R中逐行对数据框的列进行重新排序

  11. 11

    在R中逐行对数据框的列进行重新排序

  12. 12

    根据列均值对数据框的列进行重新排序

  13. 13

    R:对数据框中的行进行重新排序

  14. 14

    如何对数据帧进行重采样

  15. 15

    熊猫数据框:使用线性插值重新采样

  16. 16

    使用python重新采样数据框时出错

  17. 17

    熊猫groupby重新采样导致数据丢失

  18. 18

    按组对数据框的子集进行采样,样本大小等于数据框的另一个子集

  19. 19

    重新采样熊猫数据框并计数实例

  20. 20

    用熊猫重新采样“整洁”的数据框

  21. 21

    用系数重新采样熊猫数据框

  22. 22

    熊猫数据框重新采样而不聚合

  23. 23

    用熊猫重新采样“整洁”的数据框

  24. 24

    重新采样 Pandas 数据框无效

  25. 25

    Flutter + Firebase。按时间顺序对数据进行排序

  26. 26

    按时间间隔和条件对数据进行分组

  27. 27

    R使用变量对数据框进行排序/排序

  28. 28

    使用python对数据框中的每个项目进行排序

  29. 29

    在Python中使用列总和对数据框进行子集

热门标签

归档