以特定时间间隔重新采样 DataFrame

卢卡

我一直在研究 Pandas 中一个公开可用的数据集,其中包含美国每个州的一些空气质量统计数据。

我正在做的是汇总每个州的测量值,我遇到的问题是不同的州在不同的时间段有可用的测量值。所以,我正在收集所有数据如下:

import pandas as pd
poll = pd.read_csv('dataset.csv')
poll = poll.groupby(['State', 'Date Local']).mean()

states = pds.index.levels[0]  # All the states
pds_grouped = pds.groupby(level='State')

# Iterate throuugh each of the state and aggregae monthly
for s in states:
     flt = pds_grouped.get_group(s).groupby(pd.Grouper(level='Date Local', freq='M')).agg({'V1': 'mean',
                                                                                           'V2': 'mean',
                                                                                           'V3': 'mean',
                                                                                           'V4': 'mean'})
     print(s, flt.shape, flt.index.min(), flt.index.max(), type(flt))

这会打印如下内容:

Alabama (30, 4) 2013-12-31 00:00:00 2016-05-31 00:00:00 <class 'pandas.core.frame.DataFrame'>
Alaska (18, 4) 2014-07-31 00:00:00 2015-12-31 00:00:00 <class 'pandas.core.frame.DataFrame'>
Arizona (195, 4) 2000-01-31 00:00:00 2016-03-31 00:00:00 <class 'pandas.core.frame.DataFrame'>
Arkansas (111, 4) 2007-01-31 00:00:00 2016-03-31 00:00:00 <class 'pandas.core.frame.DataFrame'>
California (196, 4) 2000-01-31 00:00:00 2016-04-30 00:00:00 <class 'pandas.core.frame.DataFrame'>
Colorado (195, 4) 2000-01-31 00:00:00 2016-03-31 00:00:00 <class 'pandas.core.frame.DataFrame'>
Connecticut (117, 4) 2006-04-30 00:00:00 2015-12-31 00:00:00 <class 'pandas.core.frame.DataFrame'>

正如您所看到的,它们都有不同数量的测量,并且它们也跨越不同的时间段。我正在尝试创建一个动画,显示这些污染物在整个时间内的变化,如果我可以在同一时间段内获取这些数据帧并基本上用NaNs与测量所在的时间段相对应的时间段填充它会容易得多不适用于给定状态。我一直在看resample熊猫中的方法,但无法弄清楚如何指定日期范围。

广黄

尝试:

all_dates = poll.index.levels[1]
date_range = pd.date_range(all_dates.min(), all_dates.max(), freq='MS')

flt = (poll.groupby('State')
           .apply(lambda x: x.reset_index(level=1)
                            .resample('MS', on='Date Local')
                            .mean()
                            .reindex(date_range))
       )

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python Pandas,仅在特定时间重新采样

来自分类Dev

2个特定时间范围之间的Spark DataFrame查询

来自分类Dev

在白天和晚上对DataFrame进行重新采样

来自分类Dev

使用特定的日期时间索引重新索引Pandas Dataframe

来自分类Dev

在特定时间间隔内循环

来自分类Dev

特定时间间隔的查询结果

来自分类Dev

获取特定时间间隔的值

来自分类Dev

检查进出时间是否在特定时间间隔之间

来自分类Dev

在sqlite中检查特定时间间隔内的时间

来自分类Dev

在特定时间间隔后在for循环内执行setTimeout

来自分类Dev

在特定时间间隔后解析json文件

来自分类Dev

在特定时间间隔内按日期分组

来自分类Dev

芹菜:在特定时间间隔后执行任务

来自分类Dev

在特定时间间隔后如何运行方法?

来自分类Dev

AMQP连接与节点js关闭特定时间间隔

来自分类Dev

在特定时间间隔内避免重复数据

来自分类Dev

SQLite:在特定时间间隔内对数据进行分组

来自分类Dev

获取特定时间间隔内的预定事件

来自分类Dev

在特定时间间隔隐藏和显示li

来自分类Dev

对特定时间间隔内的值进行分组并计算均值

来自分类Dev

在特定时间间隔后如何检查文件是否存在

来自分类Dev

在特定时间间隔后在Firefox中删除Cookie

来自分类Dev

在特定时间间隔内避免重复数据

来自分类Dev

计算Python中特定时间间隔内的记录数

来自分类Dev

如何让 ROBLOX 中的对象在特定时间间隔内消失?

来自分类Dev

如何从数据框中绘制行的特定时间间隔?

来自分类Dev

从MultiIndex DataFrame采样

来自分类Dev

用索引之间的时间间隔重新采样大熊猫时间序列的问题

来自分类Dev

在熊猫DataFrame /系列中快速选择时间间隔

Related 相关文章

热门标签

归档