在熊猫中读取具有历史日期的CSV文件

理查德

我正在尝试读取日期格式为(UK)13/01/1800的文件,但是某些日期是1667年以前的,不能用纳秒级时间戳表示(请参见http://pandas.pydata。 org / pandas-docs / stable / gotchas.html#gotchas-timestamp-limits)。我从该页面了解到我需要创建自己的PeriodIndex来覆盖所需的范围(请参阅http://pandas.pydata.org/pandas-docs/stable/timeseries.html#timeseries-oob),但我无法理解如何将csv阅读器中的字符串转换为此periodindex中的日期。

到目前为止,我有:

span = pd.period_range('1000-01-01', '2100-01-01', freq='D')
df_earliest= pd.read_csv("objects.csv", index_col=0, names=['Object Id', 'Earliest Date'], parse_dates=[1], infer_datetime_format=True, dayfirst=True)

如何将跨度应用于日期阅读器/转换器,以便可以在数据框中创建PeriodIndex / DateTimeIndex列?

最大容量

您可以尝试通过以下方式进行操作:

fn = r'D:\temp\.data\36987699.csv'

def dt_parse(s):
    d,m,y = s.split('/')
    return pd.Period(year=int(y), month=int(m), day=int(d), freq='D')


df = pd.read_csv(fn, parse_dates=[0], date_parser=dt_parse)

输入文件:

Date,col1
13/01/1800,aaa
25/12/1001,bbb
01/03/1267,ccc

测试:

In [16]: df
Out[16]:
        Date col1
0 1800-01-13  aaa
1 1001-12-25  bbb
2 1267-03-01  ccc

In [17]: df.dtypes
Out[17]:
Date    object
col1    object
dtype: object

In [18]: df['Date'].dt.year
Out[18]:
0    1800
1    1001
2    1267
Name: Date, dtype: int64

PS,您可能想try ... catchdt_parse()函数中添加以捕获ValueError:异常-结果int()...

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在熊猫中读取具有行名称的数据框的CSV文件

来自分类Dev

使用tidyverse读取具有日期变量的csv文件

来自分类Dev

读取在SSIS中具有JSON列的csv文件吗?

来自分类Dev

读取CSV文件中具有特定模式的文本

来自分类Dev

读取具有类似csv名称的文件

来自分类Dev

读取具有多个标题的CSV文件

来自分类Dev

读取熊猫中CSV文件的所有内容(最后一行除外)

来自分类Dev

读取文件时Python熊猫中的日期解析错误

来自分类Dev

熊猫读取CSV以获取带有\ t的文件地址

来自分类Dev

使用关闭列有问题的熊猫读取csv文件

来自分类Dev

创建csv文件具有与读取文件相同的名称

来自分类Dev

在Python中读取具有超时的文件

来自分类Dev

在jupyter笔记本中,我使用熊猫打开了一个csv文件,该文件具有与游戏有关的数据,包括其上次更新日期

来自分类Dev

使用熊猫读取Python中的csv文件块

来自分类Dev

熊猫:read_csv(在单个文件中读取多个表)

来自分类Dev

无法使用熊猫从特定的.CSV文件中读取内容

来自分类Dev

加快熊猫中csv文件的此条件行读取的速度?

来自分类Dev

如何在熊猫中同时读取多个csv文件

来自分类Dev

使用熊猫读取Python中的csv文件块

来自分类Dev

使用双引号正确读取熊猫中的 CSV 文件

来自分类Dev

如何在R中读取具有不同列数的CSV文件

来自分类Dev

c#将.csv文件读取到具有重复列名的DataTable中

来自分类Dev

如何在Java中读取具有不同格式的多个csv文件

来自分类Dev

将具有多个数据节的csv文件读取到可寻址结构中

来自分类Dev

从具有不同列数的 csv 文件中读取和选择项目

来自分类Dev

在熊猫中连接CSV文件时,日期格式为chr

来自分类Dev

如何获取熊猫数据框中特定日期/时间的所有历史值?

来自分类Dev

从“熊猫”列中创建具有相似日期的列表

来自分类Dev

有条件地在熊猫中读取csv

Related 相关文章

  1. 1

    如何在熊猫中读取具有行名称的数据框的CSV文件

  2. 2

    使用tidyverse读取具有日期变量的csv文件

  3. 3

    读取在SSIS中具有JSON列的csv文件吗?

  4. 4

    读取CSV文件中具有特定模式的文本

  5. 5

    读取具有类似csv名称的文件

  6. 6

    读取具有多个标题的CSV文件

  7. 7

    读取熊猫中CSV文件的所有内容(最后一行除外)

  8. 8

    读取文件时Python熊猫中的日期解析错误

  9. 9

    熊猫读取CSV以获取带有\ t的文件地址

  10. 10

    使用关闭列有问题的熊猫读取csv文件

  11. 11

    创建csv文件具有与读取文件相同的名称

  12. 12

    在Python中读取具有超时的文件

  13. 13

    在jupyter笔记本中,我使用熊猫打开了一个csv文件,该文件具有与游戏有关的数据,包括其上次更新日期

  14. 14

    使用熊猫读取Python中的csv文件块

  15. 15

    熊猫:read_csv(在单个文件中读取多个表)

  16. 16

    无法使用熊猫从特定的.CSV文件中读取内容

  17. 17

    加快熊猫中csv文件的此条件行读取的速度?

  18. 18

    如何在熊猫中同时读取多个csv文件

  19. 19

    使用熊猫读取Python中的csv文件块

  20. 20

    使用双引号正确读取熊猫中的 CSV 文件

  21. 21

    如何在R中读取具有不同列数的CSV文件

  22. 22

    c#将.csv文件读取到具有重复列名的DataTable中

  23. 23

    如何在Java中读取具有不同格式的多个csv文件

  24. 24

    将具有多个数据节的csv文件读取到可寻址结构中

  25. 25

    从具有不同列数的 csv 文件中读取和选择项目

  26. 26

    在熊猫中连接CSV文件时,日期格式为chr

  27. 27

    如何获取熊猫数据框中特定日期/时间的所有历史值?

  28. 28

    从“熊猫”列中创建具有相似日期的列表

  29. 29

    有条件地在熊猫中读取csv

热门标签

归档