如何从Scala的RDD中获取最早的时间戳记日期

开普勒

我有一个RDD,就像((String, String), TimeStamp)我有大量的记录,我想为每个键选择具有最新TimeStamp值的记录。我尝试了以下代码,但仍在为此苦苦挣扎。有人可以帮我做到这一点吗?

我尝试的以下代码是错误的,并且无法正常工作

val context = sparkSession.read.format("jdbc")
  .option("driver", "com.mysql.jdbc.Driver")
  .option("url", url)
  .option("dbtable", "student_risk")
  .option("user", "user")
  .option("password", "password")
  .load()
context.cache();

val studentRDD = context.rdd.map(r => ((r.getString(r.fieldIndex("course_id")), r.getString(r.fieldIndex("student_id"))), r.getTimestamp(r.fieldIndex("risk_date_time"))))
val filteredRDD = studentRDD.collect().map(z => (z._1, z._2)).reduce((x, y) => (x._2.compareTo(y._2)))
扎克·祖哈尔

直接在DataFrame(context在这里命名很容易

val result = context
  .groupBy("course_id", "student_id")
  .agg(min("risk_date_time") as "risk_date_time")

然后,您可以像以前一样将其转换为RDD(如果需要)-结果具有相同的架构。

如果您确实想通过RDD执行此操作,请使用reduceByKey

studentRDD.reduceByKey((t1, t2) => if (t1.before(t2)) t1 else t2)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从日期时间列表中获取最早和最新时间

来自分类Dev

如何获取特定日期最早时间的数据?

来自分类Dev

从数据库中仅获取时间戳记日期

来自分类Dev

如何在Elasticsearch中获取时间戳记值?

来自分类Dev

Python-如何从QuerySet获取最早的日期?

来自分类Dev

从日期时间戳记获取开始和结束时间

来自分类Dev

遍历字典并获取日期时间列表的最早值

来自分类Dev

如何从Java中的字符串时间戳记中提取日期和时间

来自分类Dev

如何从Java中的字符串时间戳记中提取日期和时间

来自分类Dev

如何快速获取时间戳记间隔?

来自分类Dev

如何从字符串中获取日期信息,然后按测试对象捕获最早的结果

来自分类Dev

获取按最早日期排序的单个 MySQLi 结果中的最早和最新日期

来自分类Dev

Postgres:更新日期并保留时间戳记中的时间

来自分类Dev

PHP中以时间戳记表示的日期时间(以毫秒为单位)

来自分类Dev

日期和时间,以Postgres中的UTC时间戳记

来自分类Dev

仅获取日期的时间戳记,反之亦然

来自分类Dev

如何根据时间戳记日期查询mongodb中嵌入文档的文档?

来自分类Dev

如何在scala中没有时间获取当前日期

来自分类Dev

将日期时间戳记中的时间戳记显示为AM或PM

来自分类Dev

仅在时间戳记中使用SQL / JOIN的情况下,您只能获取第一个/最早的结果

来自分类Dev

如何比较数组中的日期以找到最早的日期?

来自分类Dev

如何按组,最早的时间戳获取数据帧的行?

来自分类Dev

根据条件从数据框中获取最早的日期

来自分类Dev

如何在Bash的“ history”输出中的时间戳记之前获取命令?

来自分类Dev

如何在Oracle中将“时间戳记转换为日期”列?

来自分类Dev

在mongo shell中以人类可读的格式显示时间戳记日期

来自分类Dev

休眠条件组按时间戳记中的日期显示结果

来自分类Dev

Postgresql日期从时间戳记到Java中的字符串

来自分类Dev

在mongo shell中以人类可读的格式显示时间戳记日期

Related 相关文章

  1. 1

    从日期时间列表中获取最早和最新时间

  2. 2

    如何获取特定日期最早时间的数据?

  3. 3

    从数据库中仅获取时间戳记日期

  4. 4

    如何在Elasticsearch中获取时间戳记值?

  5. 5

    Python-如何从QuerySet获取最早的日期?

  6. 6

    从日期时间戳记获取开始和结束时间

  7. 7

    遍历字典并获取日期时间列表的最早值

  8. 8

    如何从Java中的字符串时间戳记中提取日期和时间

  9. 9

    如何从Java中的字符串时间戳记中提取日期和时间

  10. 10

    如何快速获取时间戳记间隔?

  11. 11

    如何从字符串中获取日期信息,然后按测试对象捕获最早的结果

  12. 12

    获取按最早日期排序的单个 MySQLi 结果中的最早和最新日期

  13. 13

    Postgres:更新日期并保留时间戳记中的时间

  14. 14

    PHP中以时间戳记表示的日期时间(以毫秒为单位)

  15. 15

    日期和时间,以Postgres中的UTC时间戳记

  16. 16

    仅获取日期的时间戳记,反之亦然

  17. 17

    如何根据时间戳记日期查询mongodb中嵌入文档的文档?

  18. 18

    如何在scala中没有时间获取当前日期

  19. 19

    将日期时间戳记中的时间戳记显示为AM或PM

  20. 20

    仅在时间戳记中使用SQL / JOIN的情况下,您只能获取第一个/最早的结果

  21. 21

    如何比较数组中的日期以找到最早的日期?

  22. 22

    如何按组,最早的时间戳获取数据帧的行?

  23. 23

    根据条件从数据框中获取最早的日期

  24. 24

    如何在Bash的“ history”输出中的时间戳记之前获取命令?

  25. 25

    如何在Oracle中将“时间戳记转换为日期”列?

  26. 26

    在mongo shell中以人类可读的格式显示时间戳记日期

  27. 27

    休眠条件组按时间戳记中的日期显示结果

  28. 28

    Postgresql日期从时间戳记到Java中的字符串

  29. 29

    在mongo shell中以人类可读的格式显示时间戳记日期

热门标签

归档