如何获取DataFrame列中多个数组中对应项的最大值?

沉思

一个 DataFrame 如下:

import spark.implicits._
val df1 = List(
    ("id1", Array(0,2)),
    ("id1",Array(2,1)),
    ("id2",Array(0,3))
  ).toDF("id", "value")

+---+------+
| id| value|
+---+------+
|id1|[0, 2]|
|id1|[2, 1]|
|id2|[0, 3]|
+---+------+

我想 groupBy id 以获得每个值数组的最大池化。最大 id1 值为 Array(2,2)。我想得到的结果是:

import spark.implicits._
val res = List(
    ("id1", Array(2,2)),
    ("id2",Array(0,3))
  ).toDF("id", "value")

+---+------+
| id| value|
+---+------+
|id1|[2, 2]|
|id2|[0, 3]|
+---+------+
Jiancheng Chen
import spark.implicits._
val df1 = List(
  ("id1", Array(0,2,3)),
  ("id1",Array(2,1,4)),
  ("id2",Array(0,7,3))
).toDF("id", "value")
val df2rdd = df1.rdd
  .map(x => (x(0).toString,x.getSeq[Int](1)))
  .reduceByKey((x,y) => {
    val arrlength = x.length
    var i = 0
    val resarr = scala.collection.mutable.ArrayBuffer[Int]()
    while(i < arrlength){
      if (x(i) >= y(i)){
        resarr.append(x(i))
      } else {
        resarr.append(y(i))
      }
      i += 1
    }
    resarr
  }).toDF("id","newvalue")

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在单行数据框中获取与n个最大值相对应的列?

来自分类Dev

如何获取与数组 B 中唯一值对应的数组 A 中所有最大值的索引?

来自分类Dev

从值数组中获取多个最大值

来自分类Dev

光学API:如何获取与最大值对应的列的值?

来自分类Dev

Postgres:获取与组中其他列的最大值相对应的列的值

来自分类Dev

MSSQL通过ID从多个列中获取最大值

来自分类Dev

获取多维数组中每列的最大值

来自分类Dev

从多列数组中获取最大值

来自分类Dev

如何从字典中获取多个最大值

来自分类Dev

如何从Excel中的2列中获取最大值?

来自分类Dev

如何从Excel中的2列中获取最大值?

来自分类Dev

我如何从数组中获取4个最大值

来自分类Dev

如何在对象数组中获取最大值

来自分类Dev

获取列组合及其对应的索引在python中的乘积的最大值

来自分类Dev

如何在Ruby中获取数组第二列的最大值和总和

来自分类Dev

如何从DataFrame中获取具有最大值的列的列名

来自分类Dev

如何从 R 中跨多个数据帧的公共列中找到最大值/最小值

来自分类Dev

如何使用AWK将数字集保留在多个数组中并显示最大值?

来自分类Dev

如何从单个表中获取两列的最大值?

来自分类Dev

如何获取单行中多列的最大值?

来自分类Dev

如何在MySQL中获取列的最大值

来自分类Dev

scala:如何获取数据框中列的最大值

来自分类Dev

获取一列中的值与矩阵(R)中其他列的最大值相对应?

来自分类Dev

获取一列中的值与矩阵(R)中其他列的最大值相对应?

来自分类Dev

如何显示数组中的最大值

来自分类Dev

如何找到数组中的最大值?

来自分类Dev

数据帧数组,在 Pandas 中获取每个数据帧的最大值和总和

来自分类Dev

如何从一列中检索与数据框中其他列的最大值对应的值

来自分类Dev

根据另一列中的行子集从多个列中获取最大值

Related 相关文章

  1. 1

    如何在单行数据框中获取与n个最大值相对应的列?

  2. 2

    如何获取与数组 B 中唯一值对应的数组 A 中所有最大值的索引?

  3. 3

    从值数组中获取多个最大值

  4. 4

    光学API:如何获取与最大值对应的列的值?

  5. 5

    Postgres:获取与组中其他列的最大值相对应的列的值

  6. 6

    MSSQL通过ID从多个列中获取最大值

  7. 7

    获取多维数组中每列的最大值

  8. 8

    从多列数组中获取最大值

  9. 9

    如何从字典中获取多个最大值

  10. 10

    如何从Excel中的2列中获取最大值?

  11. 11

    如何从Excel中的2列中获取最大值?

  12. 12

    我如何从数组中获取4个最大值

  13. 13

    如何在对象数组中获取最大值

  14. 14

    获取列组合及其对应的索引在python中的乘积的最大值

  15. 15

    如何在Ruby中获取数组第二列的最大值和总和

  16. 16

    如何从DataFrame中获取具有最大值的列的列名

  17. 17

    如何从 R 中跨多个数据帧的公共列中找到最大值/最小值

  18. 18

    如何使用AWK将数字集保留在多个数组中并显示最大值?

  19. 19

    如何从单个表中获取两列的最大值?

  20. 20

    如何获取单行中多列的最大值?

  21. 21

    如何在MySQL中获取列的最大值

  22. 22

    scala:如何获取数据框中列的最大值

  23. 23

    获取一列中的值与矩阵(R)中其他列的最大值相对应?

  24. 24

    获取一列中的值与矩阵(R)中其他列的最大值相对应?

  25. 25

    如何显示数组中的最大值

  26. 26

    如何找到数组中的最大值?

  27. 27

    数据帧数组,在 Pandas 中获取每个数据帧的最大值和总和

  28. 28

    如何从一列中检索与数据框中其他列的最大值对应的值

  29. 29

    根据另一列中的行子集从多个列中获取最大值

热门标签

归档