当其中一些在pyspark中为null时发现时间戳的差异

然后缠结

我在pyspark数据帧中有两个时间戳列,如下所示:

+--------------------+--------------------+
|          TIME_STAMP|         TIME_STAMP2|
+--------------------+--------------------+
|2020-01-03 12:58:...|                null|
|2020-01-03 12:59:...|                null|
|2020-01-03 13:01:...|                null|
|2020-01-03 13:02:...|                null|
|2020-01-03 13:04:...|                null|
|2020-01-03 13:05:...|                null|
|2020-01-03 13:07:...|                null|
|2020-01-03 13:08:...|2020-01-03 12:58:...|
|2020-01-03 13:10:...|2020-01-03 12:59:...|
|2020-01-03 13:11:...|2020-01-03 13:01:...|
|2020-01-03 13:13:...|2020-01-03 13:02:...|
|2020-01-03 13:14:...|2020-01-03 13:04:...|
|2020-01-03 13:16:...|2020-01-03 13:05:...|
|2020-01-03 13:17:...|2020-01-03 13:07:...|
|2020-01-03 13:19:...|2020-01-03 13:08:...|
|2020-01-03 13:20:...|2020-01-03 13:10:...|
|2020-01-03 13:22:...|2020-01-03 13:11:...|
|2020-01-03 13:23:...|2020-01-03 13:13:...|
|2020-01-03 13:24:...|2020-01-03 13:14:...|
|2020-01-03 13:26:...|2020-01-03 13:16:...|
+--------------------+--------------------+

我想找到不同之处,但是,如果其中一个值为null,则我报错。有没有办法解决这个问题?这是我得到的错误:

遇到错误:“由于数据类型不匹配,无法解析'(TIME_STAMP- TIME_STAMP2)':'(TIME_STAMP- TIME_STAMP2)'需要(数字或日历间隔)类型,而不是时间戳;

zz

您可以将时间戳记值转换为long并将其减去。您将在几秒钟内得到差异:

    from pyspark.sql import functions as f

    df.withColumn('diff_in_seconds', f.col('TIME_STAMP').cast('long') - f.col('TIME_STAMP2').cast('long'))
    df.show(10, False)

请注意,如果任何值均为“ null”,则结果也将为“ null”。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Javascript中,使内容换行,其中一些换行

来自分类Dev

当其中一些文件包含空格时,如何在一组文件中搜索字符串?

来自分类Dev

在检查javascript数组中的重复值并忽略其中一些重复值时,我的代码存在问题

来自分类Dev

VBA Excel在时间格式为m / d / yyyy hh:mm:ss时发现时间差异

来自分类Dev

给定N个人,其中一些是敌人,找到没有敌人的时间间隔数

来自分类Dev

当其中一些方法无效而另一些无效时,如何从 Controller 调用方法?

来自分类Dev

NSPredicate在数组数组上,其中一些为空

来自分类Dev

当其中一些没有前导对象时对齐 ListTile 项目

来自分类Dev

YII2 - 在 gridView 中处理 NULL 值 - 显示一列外键,其中一些可能为 NULL

来自分类Dev

按多个列分组,其中一些具有单个值(在Python中)

来自分类Dev

如何重组其中一些在R中应具有相同值的列

来自分类Dev

更改Bootstrap条纹表中的颜色...但仅在其中一些颜色上

来自分类Dev

扫描到其中一些是指针的结构字段

来自分类Dev

Akka演员:如何选择其中一些?

来自分类Dev

逐行读取文件,而忽略其中一些

来自分类Dev

其中一些代码无法运行

来自分类Dev

批量重命名文件删除其中一些

来自分类Dev

过滤一些字符串,但其中一些不过滤!用 grepl

来自分类Dev

为几个命令创建一个bash别名,其中一些命令需要sudo

来自分类Dev

如何通过一个指定的键对字典列表进行排序,其中一些值为 None?

来自分类Dev

python Regex中的一些差异

来自分类Dev

使用所有列NA过滤data.frame,但保留其中一些为NA

来自分类Dev

Gradle复制文件并仅扩展其中一些文件和/或忽略其他文件中的美元符号

来自分类Dev

连接excel文件中的所有工作表,其中一些具有不同的skiprows标准

来自分类Dev

使用今天的日期和时间创建一个时间戳文件夹并将一些文件夹复制到其中

来自分类Dev

当其中一列为NULL /空白时,SQL Join具有两列

来自分类Dev

为什么有些事情在C ++中留下未定义的行为?如果其中一些在标准中预定义会更好吗?

来自分类Dev

将日期字符串元胞数组(只有其中一些包含时间)转换为浮点数

来自分类Dev

更新mysql中的2个字段(其中一个更新为null更新)

Related 相关文章

  1. 1

    在Javascript中,使内容换行,其中一些换行

  2. 2

    当其中一些文件包含空格时,如何在一组文件中搜索字符串?

  3. 3

    在检查javascript数组中的重复值并忽略其中一些重复值时,我的代码存在问题

  4. 4

    VBA Excel在时间格式为m / d / yyyy hh:mm:ss时发现时间差异

  5. 5

    给定N个人,其中一些是敌人,找到没有敌人的时间间隔数

  6. 6

    当其中一些方法无效而另一些无效时,如何从 Controller 调用方法?

  7. 7

    NSPredicate在数组数组上,其中一些为空

  8. 8

    当其中一些没有前导对象时对齐 ListTile 项目

  9. 9

    YII2 - 在 gridView 中处理 NULL 值 - 显示一列外键,其中一些可能为 NULL

  10. 10

    按多个列分组,其中一些具有单个值(在Python中)

  11. 11

    如何重组其中一些在R中应具有相同值的列

  12. 12

    更改Bootstrap条纹表中的颜色...但仅在其中一些颜色上

  13. 13

    扫描到其中一些是指针的结构字段

  14. 14

    Akka演员:如何选择其中一些?

  15. 15

    逐行读取文件,而忽略其中一些

  16. 16

    其中一些代码无法运行

  17. 17

    批量重命名文件删除其中一些

  18. 18

    过滤一些字符串,但其中一些不过滤!用 grepl

  19. 19

    为几个命令创建一个bash别名,其中一些命令需要sudo

  20. 20

    如何通过一个指定的键对字典列表进行排序,其中一些值为 None?

  21. 21

    python Regex中的一些差异

  22. 22

    使用所有列NA过滤data.frame,但保留其中一些为NA

  23. 23

    Gradle复制文件并仅扩展其中一些文件和/或忽略其他文件中的美元符号

  24. 24

    连接excel文件中的所有工作表,其中一些具有不同的skiprows标准

  25. 25

    使用今天的日期和时间创建一个时间戳文件夹并将一些文件夹复制到其中

  26. 26

    当其中一列为NULL /空白时,SQL Join具有两列

  27. 27

    为什么有些事情在C ++中留下未定义的行为?如果其中一些在标准中预定义会更好吗?

  28. 28

    将日期字符串元胞数组(只有其中一些包含时间)转换为浮点数

  29. 29

    更新mysql中的2个字段(其中一个更新为null更新)

热门标签

归档