Python:在csv文件中每小时计算平均值和标准偏差

价过程

我有一个很大的csv文件,数据看起来像这样:

YY-MO-DD HH-MI-SS_SSS    |     Temperature   |      Magnetic
2015-12-07 20:51:06:608  |        22.7       |        32.3
2015-12-07 20:51:07:609  |        22.5       |        47.7
  ....                            ...                  ...

现在,我想将python与pandas一起使用来创建如下所示的csv:

   Hour       |     Average Temp   |    Average Mag
   20:00      |         22.6       |       40
   21:00      |         ...        |       ...

依此类推,每个24小时都如此。

第二件事是我想做相同的平均,但是对于一个月的每一天:

Date       |     Average Temp   |    Average Mag
7-12-2015  |         22.6       |       40
8-12-2015  |         ...        |       ...

有没有在python中执行此操作的好方法?我尝试了excel,但是csv非常大,并且我有很多(希望创建一个循环来对每个文件执行相同的操作)

谢谢 !

耶斯列尔

你可以先转换to_datetime,然后set_index和最后resample与聚集meanstd

0.18.0新的重采样api版本

#convert column to datetime
df['YY-MO-DD HH-MI-SS_SSS'] = pd.to_datetime(df['YY-MO-DD HH-MI-SS_SSS'], format='%Y-%m-%d %H:%M:%S:%f')

#set index from column
df = df.set_index('YY-MO-DD HH-MI-SS_SSS')

#resample and aggregate mean
print df.resample('H').mean()
                       Temperature  Magnetic
YY-MO-DD HH-MI-SS_SSS                       
2015-12-07 20:00:00           22.6      40.0

print df.resample('H').std()
                       Temperature   Magnetic
YY-MO-DD HH-MI-SS_SSS                        
2015-12-07 20:00:00       0.141421  10.889444

print df.resample('D').mean()
                       Temperature  Magnetic
YY-MO-DD HH-MI-SS_SSS                       
2015-12-07                    22.6      40.0
print df.resample('D').std()
                       Temperature   Magnetic
YY-MO-DD HH-MI-SS_SSS                        
2015-12-07                0.141421  10.889444

如果要将全部聚合到新列中,可以使用:

#resample and aggregate mean
df1 = df.resample('H').agg(['mean','std'])
df1.columns = [' '.join(col) for col in df1.columns]
print df1.reset_index()
  YY-MO-DD HH-MI-SS_SSS  Temperature mean  Temperature std  Magnetic mean  \
0   2015-12-07 20:00:00              22.6         0.141421           40.0   

   Magnetic std  
0     10.889444  

df2 = df.resample('D').agg(['mean','std'])
df2.columns = [' '.join(col) for col in df2.columns]
print df2.reset_index()
  YY-MO-DD HH-MI-SS_SSS  Temperature mean  Temperature std  Magnetic mean  \
0            2015-12-07              22.6         0.141421           40.0   

   Magnetic std  
0     10.889444  

如果您需要写to_csv(可能没有索引):

df1.to_csv('myfile.csv', index=False)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

C ++计算平均值和标准偏差

来自分类Dev

多次采样并使用趋势线计算平均值的标准偏差和标准误差

来自分类Dev

按类别绘制平均值和标准偏差

来自分类Dev

数组参数中值的平均值和标准偏差

来自分类Dev

绘制平均值和标准偏差

来自分类Dev

读取带有浮点数的文件,计算C中的大小,最大值,最小值,平均值,中位数和标准偏差

来自分类Dev

计算平均值和标准偏差,而忽略0值

来自分类Dev

删除“#DIV / 0!” 用于平均值和标准偏差计算

来自分类Dev

使用do while循环计算平均值和标准偏差

来自分类Dev

如何在excel中计算相同范围的平均值和标准偏差

来自分类Dev

使用VBA在Excel中查找显示的过滤数据的平均值和标准偏差

来自分类Dev

如何从小时数据库中存储日期值的表中获取每日总数的平均值和标准偏差?

来自分类Dev

熊猫计算每小时平均值

来自分类Dev

熊猫计算每小时平均值

来自分类Dev

PySpark:一步计算平均值,标准偏差和平均值附近的那些值

来自分类Dev

PySpark:一步计算平均值,标准偏差和平均值附近的那些值

来自分类Dev

R:如何计算人口标准偏差和平均值

来自分类Dev

查找大熊猫中按星期几分组的标准偏差和时间平均值

来自分类Dev

如何保存Jmeter侦听器的平均值和标准偏差

来自分类Dev

R平均值和标准偏差的手动箱线图(ggplot2)

来自分类Dev

绘制Pandas Dataframe的直方图及其平均值和标准偏差,得到ValueError

来自分类Dev

matplotlib / python-如何绘制这样的图?平均值±3 *标准偏差

来自分类Dev

在 Python 中使用标准偏差的熊猫移动平均值

来自分类Dev

计算R中就寝时间的平均值和标准偏差(hh:mm)-问题是午夜之前/之后的时间

来自分类Dev

使用Python从CSV文件中查找标准偏差

来自分类Dev

按小时计算json数据的平均值

来自分类Dev

ICollection <T>使用LINQ计算每小时的平均值

来自分类Dev

ICollection <T>使用LINQ计算每小时的平均值

来自分类Dev

tf.compat.v1.random_normal()中random_normal的平均值和标准偏差是什么意思?

Related 相关文章

  1. 1

    C ++计算平均值和标准偏差

  2. 2

    多次采样并使用趋势线计算平均值的标准偏差和标准误差

  3. 3

    按类别绘制平均值和标准偏差

  4. 4

    数组参数中值的平均值和标准偏差

  5. 5

    绘制平均值和标准偏差

  6. 6

    读取带有浮点数的文件,计算C中的大小,最大值,最小值,平均值,中位数和标准偏差

  7. 7

    计算平均值和标准偏差,而忽略0值

  8. 8

    删除“#DIV / 0!” 用于平均值和标准偏差计算

  9. 9

    使用do while循环计算平均值和标准偏差

  10. 10

    如何在excel中计算相同范围的平均值和标准偏差

  11. 11

    使用VBA在Excel中查找显示的过滤数据的平均值和标准偏差

  12. 12

    如何从小时数据库中存储日期值的表中获取每日总数的平均值和标准偏差?

  13. 13

    熊猫计算每小时平均值

  14. 14

    熊猫计算每小时平均值

  15. 15

    PySpark:一步计算平均值,标准偏差和平均值附近的那些值

  16. 16

    PySpark:一步计算平均值,标准偏差和平均值附近的那些值

  17. 17

    R:如何计算人口标准偏差和平均值

  18. 18

    查找大熊猫中按星期几分组的标准偏差和时间平均值

  19. 19

    如何保存Jmeter侦听器的平均值和标准偏差

  20. 20

    R平均值和标准偏差的手动箱线图(ggplot2)

  21. 21

    绘制Pandas Dataframe的直方图及其平均值和标准偏差,得到ValueError

  22. 22

    matplotlib / python-如何绘制这样的图?平均值±3 *标准偏差

  23. 23

    在 Python 中使用标准偏差的熊猫移动平均值

  24. 24

    计算R中就寝时间的平均值和标准偏差(hh:mm)-问题是午夜之前/之后的时间

  25. 25

    使用Python从CSV文件中查找标准偏差

  26. 26

    按小时计算json数据的平均值

  27. 27

    ICollection <T>使用LINQ计算每小时的平均值

  28. 28

    ICollection <T>使用LINQ计算每小时的平均值

  29. 29

    tf.compat.v1.random_normal()中random_normal的平均值和标准偏差是什么意思?

热门标签

归档