df1:
Timestamp:
1995-08-01T00:00:01.000+0000
有没有一种方法可以使用pyspark在数据框的时间戳列中分隔月份中的某天。无法提供代码,我是新手。我不知道如何进行。
您可以使用unix_timestamp解析此时间戳:
from pyspark.sql import functions as F
format = "yyyy-MM-dd'T'HH:mm:ss.SSSZ"
df2 = df1.withColumn('Timestamp2', F.unix_timestamp('Timestamp', format).cast('timestamp'))
然后,您可以在新的“时间戳记”列中使用“ dayofmonth”:
df2.select(F.dayofmonth('Timestamp2'))
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句