根据Google的文档,我正在处理的时间戳是:
RFC3339 UTC“ Zulu”格式的时间戳,精确到纳秒。示例:“ 2014-10-02T15:01:23.045123456Z”。
因此,例如,如果字符串为'2019-11-06T06:24:42.558008Z'
,则pd.to_datetime('2019-11-06T06:24:42.558008Z',infer_datetime_format=True)
可以工作并返回Timestamp('2019-11-06 06:24:42.558008')
。
但是,让熊猫推断格式很慢,而且我有很多行数据。我将通过什么format
参数来帮助加快处理速度?
您可以将to_datetime与utc=True
+ tz_convert结合使用:
import pandas as pd
utc = pd.to_datetime('2019-11-06T06:24:42.558008Z', utc=True).tz_convert(None)
inferred = pd.to_datetime('2019-11-06T06:24:42.558008Z', infer_datetime_format=True)
print(utc == inferred)
输出量
True
从以下文档tz_convert
:
无tz会转换为UTC并删除时区信息。
请注意,只能这样做:
utc = pd.to_datetime('2019-11-06T06:24:42.558008Z', utc=True) # or pd.to_datetime('2019-11-06T06:24:42.558008Z')
与进行比较时会引发TypeError异常inferred
:
TypeError:无法比较tz天真和tz感知时间戳
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句