搜索

搜索

如何获取DataFrame列中多个数组中对应项的最大值？

debugcn 发表于 Dev

19

沉思

一个 DataFrame 如下：

import spark.implicits._
val df1 = List(
    ("id1", Array(0,2)),
    ("id1",Array(2,1)),
    ("id2",Array(0,3))
  ).toDF("id", "value")

+---+------+
| id| value|
+---+------+
|id1|[0, 2]|
|id1|[2, 1]|
|id2|[0, 3]|
+---+------+

我想 groupBy id 以获得每个值数组的最大池化。最大 id1 值为 Array(2,2)。我想得到的结果是：

import spark.implicits._
val res = List(
    ("id1", Array(2,2)),
    ("id2",Array(0,3))
  ).toDF("id", "value")

+---+------+
| id| value|
+---+------+
|id1|[2, 2]|
|id2|[0, 3]|
+---+------+

Jiancheng Chen

import spark.implicits._
val df1 = List(
  ("id1", Array(0,2,3)),
  ("id1",Array(2,1,4)),
  ("id2",Array(0,7,3))
).toDF("id", "value")
val df2rdd = df1.rdd
  .map(x => (x(0).toString,x.getSeq[Int](1)))
  .reduceByKey((x,y) => {
    val arrlength = x.length
    var i = 0
    val resarr = scala.collection.mutable.ArrayBuffer[Int]()
    while(i < arrlength){
      if (x(i) >= y(i)){
        resarr.append(x(i))
      } else {
        resarr.append(y(i))
      }
      i += 1
    }
    resarr
  }).toDF("id","newvalue")

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-21

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

如何在单行数据框中获取与n个最大值相对应的列？

来自分类Dev

如何获取与数组 B 中唯一值对应的数组 A 中所有最大值的索引？

来自分类Dev

从值数组中获取多个最大值

来自分类Dev

光学API：如何获取与最大值对应的列的值？

来自分类Dev

Postgres：获取与组中其他列的最大值相对应的列的值

来自分类Dev

MSSQL通过ID从多个列中获取最大值

来自分类Dev

获取多维数组中每列的最大值

来自分类Dev

从多列数组中获取最大值

来自分类Dev

如何从字典中获取多个最大值

来自分类Dev

如何从Excel中的2列中获取最大值？

来自分类Dev

如何从Excel中的2列中获取最大值？

来自分类Dev

我如何从数组中获取4个最大值

来自分类Dev

如何在对象数组中获取最大值

来自分类Dev

获取列组合及其对应的索引在python中的乘积的最大值

来自分类Dev

如何在Ruby中获取数组第二列的最大值和总和

来自分类Dev

如何从DataFrame中获取具有最大值的列的列名

来自分类Dev

如何从 R 中跨多个数据帧的公共列中找到最大值/最小值

来自分类Dev

如何使用AWK将数字集保留在多个数组中并显示最大值？

来自分类Dev

如何从单个表中获取两列的最大值？

来自分类Dev

如何获取单行中多列的最大值？

来自分类Dev

如何在MySQL中获取列的最大值

来自分类Dev

scala：如何获取数据框中列的最大值

来自分类Dev

获取一列中的值与矩阵（R）中其他列的最大值相对应？

来自分类Dev

获取一列中的值与矩阵（R）中其他列的最大值相对应？

来自分类Dev

如何显示数组中的最大值

来自分类Dev

如何找到数组中的最大值？

来自分类Dev

数据帧数组，在 Pandas 中获取每个数据帧的最大值和总和

来自分类Dev

如何从一列中检索与数据框中其他列的最大值对应的值

来自分类Dev

根据另一列中的行子集从多个列中获取最大值

Related 相关文章

文章

热门标签

归档