在熊猫数据框中估算缺少的日期

光之锤
df = pd.read_csv(
    'https://media-doselect.s3.amazonaws.com/generic/MJjpYqLzv08xAkjqLp1ga1Aq/Historical_Data.csv')
df.head()

    Date        Article_ID   Country_Code   Sold_Units
0   20170817        1132       AT               1
1   20170818        1132       AT               1
2   20170821        1132       AT               1
3   20170822        1132       AT               1
4   20170906        1132       AT               1

我有上述的DataFrame。请注意,“日期”列的类型为int64,缺少第19和20个日期。

我想将其转换为yyyy-mm-dd格式,并在商品ID,出口代码和售出单位中输入值0的缺失日期。

到目前为止,我已经尝试过:

df['Date'] = pd.to_datetime(df['Date'].astype(str), format='%Y-%m-%d')

以所需的格式获取日期。

    Date         Article_ID  Outlet_Code   Sold_Units
0   2017-08-17      1132       AT               1
1   2017-08-18      1132       AT               1
2   2017-08-21      1132       AT               1
3   2017-08-22      1132       AT               1
4   2017-09-06      1132       AT               1

但是,如何估算缺少的19日和20日,并在新添加的日期行下估算具有0的行?

这是我所做的返回值错误的摘要:无法从重复的轴重新索引。

在此处输入图片说明

安塞夫

DataFrame.asfreq在删除重复项,然后添加重复数据并进行排序之后,可以使用reindex:

df['Date'] = pd.to_datetime(df['Date'].astype(str), format='%Y-%m-%d')
df2=df[df.duplicated('Date')].set_index('Date')
new_df=df.drop_duplicates('Date').set_index('Date').asfreq('D',fill_value=0)
new_df=new_df.append(df2).sort_index().reset_index()
print(new_df)

         Date  Article_ID Country_Code  Sold_Units
0  2017-08-17        1132           AT           1
1  2017-08-17        1132           AT           1
2  2017-08-18        1132           AT           1
3  2017-08-19           0            0           0
4  2017-08-20           0            0           0
5  2017-08-21        1132           AT           1
6  2017-08-22        1132           AT           1
7  2017-08-23           0            0           0
8  2017-08-24           0            0           0
9  2017-08-25           0            0           0
10 2017-08-26           0            0           0
11 2017-08-27           0            0           0
12 2017-08-28           0            0           0
13 2017-08-29           0            0           0
14 2017-08-30           0            0           0
15 2017-08-31           0            0           0
16 2017-09-01           0            0           0
17 2017-09-02           0            0           0
18 2017-09-03           0            0           0
19 2017-09-04           0            0           0
20 2017-09-05           0            0           0
21 2017-09-06        1132           AT           1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在熊猫数据框的平面文件中插入缺少的日期

来自分类Dev

填充序列中缺少日期的数据框

来自分类Dev

在数据框中填写缺少的日期

来自分类Dev

在熊猫数据框中附加日期

来自分类Dev

在熊猫数据框中填写缺少的行值

来自分类Dev

如何填充熊猫数据框中缺少的小时值

来自分类Dev

在数据框中添加缺少的日期索引

来自分类Dev

在熊猫数据框中的日期变量中添加月份

来自分类Dev

绘制熊猫数据框日期

来自分类Dev

AE数据:估算缺少的结束日期,然后在开始日期至结束日期之间插入行

来自分类Dev

检查熊猫数据框中是否存在日期

来自分类Dev

在熊猫数据框中创建日期时间索引

来自分类Dev

从熊猫数据框中消除特定日期的最快方法

来自分类Dev

使用日期的熊猫数据框中的列算术

来自分类Dev

熊猫中两个数据框之间的匹配日期

来自分类Dev

为熊猫中的特定日期范围过滤数据框

来自分类Dev

根据日期从熊猫数据框中删除行

来自分类Dev

如何更改熊猫数据框中列的日期时间格式

来自分类Dev

在熊猫数据框中以间隔的日期填写缺失的观测值

来自分类Dev

在熊猫数据框中的日期时间上使用.count

来自分类Dev

如何在熊猫数据框中删除日期和时间?

来自分类Dev

如何删除熊猫数据框中的日期范围

来自分类Dev

从整个熊猫数据框中减去修复日期-python

来自分类Dev

如何根据熊猫数据框中的条件选择日期

来自分类Dev

月和日期在熊猫数据框中混乱

来自分类Dev

熊猫中两个数据框之间的匹配日期

来自分类Dev

处理熊猫数据框中的多种日期格式

来自分类Dev

在 400K 熊猫数据框中添加随机日期

来自分类Dev

从熊猫数据框中获取多个最小和最大日期

Related 相关文章

热门标签

归档