使用Spark数据框,在窗口函数中使用间隔的示例

飞行员7

我有一个订单的DataFrame(contactidid,orderdate,orderamount),并且我想要一个新列,其中包含每个订单的该订单之前12个月内该联系人的所有订单金额之和。我认为最好的方法是在Spark> 1.5中使用Windowing函数和新的INTERVAL功能。

但是我很难使这项工作或查找文档。我最好的猜测是:

 val dfOrdersPlus = dfOrders
   .withColumn("ORDERAMOUNT12MONTH", 
      expr("sum(ORDERAMOUNT) OVER (PARTITION BY CONTACTID ORDER BY ORDERDATE RANGE BETWEEN INTERVAL 12 months preceding and INTERVAL 1 day preceding)"));

但是我得到了一个RuntimeException:'预期输入结束'。关于这个“ expr”我做错了什么以及在哪里可以找到有关新INTERVAL文字的文档的任何想法?

零323

就目前而言:

  • 中不支持窗口功能expr要使用窗口功能,您必须DataFrame在已注册的表上使用DSL或原始SQL(仅适用于Spark 1.5和1.6)

  • 窗口函数仅在数字类型上支持范围间隔。您不能使用DateType/TimestampType和日期INTERVAL表达式。(Spark 1.5、1.6、2.0.0预览)

如果要使用带有日期或时间列的窗口函数,可以先将它们转换为Unix时间戳。您将在Spark Window Functions中找到完整的示例-rangeBetween日期

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在窗口函数中使用环形数据结构

来自分类Dev

如何在Spark中使用窗口函数过滤数据

来自分类Dev

在Apache Spark SQL中,如何在窗口函数中使用collect_list时删除重复的行?

来自分类Dev

无法使用从窗口1的文本框中获取的文本在窗口2中使用

来自分类Dev

如何在C#.Net中使用鼠标指针在窗口内移动图片框

来自分类常见问题

如何在Spark / Cala中使用窗口函数使用countDistinct?

来自分类Dev

如何在Spark / Cala中使用窗口函数使用countDistinct?

来自分类Dev

Python Pandas在函数中使用数据框

来自分类Dev

Python Pandas在函数中使用数据框

来自分类Dev

Spark:用于数据框的Python窗口函数

来自分类Dev

如何在Spark中的映射函数中使用数据框?

来自分类Dev

如何在 Spark 中使用 from_json() 数据框?

来自分类Dev

过滤数据框以在多个renderPlot函数中使用

来自分类Dev

在R中:帮助在数据框中使用rle()函数

来自分类Dev

如何在dask数据框中使用等级函数?

来自分类Dev

在R中:帮助在数据框中使用rle()函数

来自分类Dev

在函数中使用Dplyr创建新数据框

来自分类Dev

如何查看包示例中使用的数据

来自分类Dev

如何使用Delphi在窗口非客户区域中使用自定义光标

来自分类Dev

如何使用Delphi在窗口非客户区域中使用自定义光标

来自分类Dev

在数据框中使用“或”

来自分类Dev

如何在Hive / Spark SQL中使用窗口函数删除重叠

来自分类Dev

在窗口引用上使用JQuery?

来自分类Dev

如何使用pyspark数据框窗口功能

来自分类Dev

在窗口定义中使用转换器时“找不到命名的资源”

来自分类Dev

在窗口定义中使用转换器时“找不到命名的资源”

来自分类Dev

在BigQuery中使用UDF时,是否可以在窗口之间保持共享状态?

来自分类Dev

在窗口上自动更改名称,并在WinActivate中使用它

来自分类Dev

在C#中使用DateTime在窗口表单中查找日期

Related 相关文章

  1. 1

    如何在窗口函数中使用环形数据结构

  2. 2

    如何在Spark中使用窗口函数过滤数据

  3. 3

    在Apache Spark SQL中,如何在窗口函数中使用collect_list时删除重复的行?

  4. 4

    无法使用从窗口1的文本框中获取的文本在窗口2中使用

  5. 5

    如何在C#.Net中使用鼠标指针在窗口内移动图片框

  6. 6

    如何在Spark / Cala中使用窗口函数使用countDistinct?

  7. 7

    如何在Spark / Cala中使用窗口函数使用countDistinct?

  8. 8

    Python Pandas在函数中使用数据框

  9. 9

    Python Pandas在函数中使用数据框

  10. 10

    Spark:用于数据框的Python窗口函数

  11. 11

    如何在Spark中的映射函数中使用数据框?

  12. 12

    如何在 Spark 中使用 from_json() 数据框?

  13. 13

    过滤数据框以在多个renderPlot函数中使用

  14. 14

    在R中:帮助在数据框中使用rle()函数

  15. 15

    如何在dask数据框中使用等级函数?

  16. 16

    在R中:帮助在数据框中使用rle()函数

  17. 17

    在函数中使用Dplyr创建新数据框

  18. 18

    如何查看包示例中使用的数据

  19. 19

    如何使用Delphi在窗口非客户区域中使用自定义光标

  20. 20

    如何使用Delphi在窗口非客户区域中使用自定义光标

  21. 21

    在数据框中使用“或”

  22. 22

    如何在Hive / Spark SQL中使用窗口函数删除重叠

  23. 23

    在窗口引用上使用JQuery?

  24. 24

    如何使用pyspark数据框窗口功能

  25. 25

    在窗口定义中使用转换器时“找不到命名的资源”

  26. 26

    在窗口定义中使用转换器时“找不到命名的资源”

  27. 27

    在BigQuery中使用UDF时,是否可以在窗口之间保持共享状态?

  28. 28

    在窗口上自动更改名称,并在WinActivate中使用它

  29. 29

    在C#中使用DateTime在窗口表单中查找日期

热门标签

归档