如何使用熊猫绘制年度数据集？

debugcn 发表于 Dev

涡虫

我想绘制每年使用 {a, b} 对的折线图。

X 轴应为年份，y 轴应为用法。

这是我的数据集。

a   b       year    usage   
a2  10104   2011    7.292787
a0  10104   2012    43.545533
b0  12011   2009    96.130359
b1  12011   2009    7.658487
b1  14102   2010    6.975572

平方

使用pivot_table重新排列数据，使得我有组合a和b在列，year在索引中。

但是，一旦我们进行了旋转，可能会丢失数据。通过interpolate与index参数一起使用，我们用插值填充缺失数据，同时保持与索引值的相对变化成比例。当索引值不是均匀分隔时，这很重要，例如[2005, 2006, 2008]. 如果索引是统一分隔的，那么使用index不会有什么坏处，因为它和默认的一样。

d1 = df.pivot_table('usage', 'year', ['a', 'b']).interpolate('index')
d1.index = pd.PeriodIndex(d1.index, freq='A')
d1.plot()

对@jezrael 评论的回应

观察数据的样子是有益的 interpolate

d1 = df.pivot_table('usage', 'year', ['a', 'b'])
d1.index = pd.PeriodIndex(d1.index, freq='A')
d1

a            a0        a2         b0        b1          
b         10104     10104      12011     12011     14102
year                                                    
2009        NaN       NaN  96.130359  7.658487       NaN
2010        NaN       NaN        NaN       NaN  6.975572
2011        NaN  7.292787        NaN       NaN       NaN
2012  43.545533       NaN        NaN       NaN       NaN

在这种情况下，我们看不到会发生什么。但我想象有更多的数据，我们会看到NaN稀疏数据之间的差距。我们可以按比例填充，而不是向前填充。

d1 = df.pivot_table('usage', 'year', ['a', 'b']).interpolate('index')
d1.index = pd.PeriodIndex(d1.index, freq='A')
d1

a            a0        a2         b0        b1          
b         10104     10104      12011     12011     14102
year                                                    
2009        NaN       NaN  96.130359  7.658487       NaN
2010        NaN       NaN  96.130359  7.658487  6.975572
2011        NaN  7.292787  96.130359  7.658487  6.975572
2012  43.545533  7.292787  96.130359  7.658487  6.975572

再说一次，这将显示出只有更多数据的好处。与这些数据一样，我们只能观察到有限的前向填充。

关于mean
注意，我使用pivot_table和pivot_table处理的事情之一是index/column规范中是否存在重复项。它将使用aggfunc. 默认情况下，该功能是mean. 但是，在这种情况下，根据已提供的数据，没有重复的a/b/year组合。因此，没有发生聚合。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-12

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何使用熊猫绘制年度数据集？

如何使用熊猫绘制年度数据集？

用年度数据绘制大熊猫数据框

使用Python /熊猫匹配样本对年度数据

如何使用 My Sql 获取财政年度数据

在熊猫时间序列中将月度数据转换为年度数据

如何在Google Analytics（分析）上查看年度数据？

如何在Google Analytics（分析）上查看年度数据？

使用SQL汇总不同月份的年度数据

调整年度数据

如何使用Shiny绘制上传的数据集？

将季度数据转换为年度数据

Stata：基于年度数据减少观察

如何绘制熊猫数据框？

如何按会计年度对熊猫数据分组？

在熊猫数据框上使用groupby按财务年度分组

在熊猫数据框上使用groupby按财务年度分组

如何使用点绘制熊猫数据框的两列？

如何使用 matplotlib 绘制熊猫数据框行的图形？

当我有按月查询时，如何在ssrs 2005中表示年度数据

如何执行每日每月一次的年度数据更新

如何从数组android studio中的年度数组中获取数据json？

如何使用errbar绘制多个数据集？

如何使用函数绘制两个不同的数据集？

使用正确的x轴格式绘制分钟刻度数据？

使用熊猫平衡数据集

如何从速度数据集创建向量图？

如何从速度数据集创建向量图？

使用alexnet和目录流来训练灰度数据集

如何绘制熊猫数据框的某些行？

绘制熊猫数据时如何禁用标签？