搜索

搜索

如何获取DataFrame中每个键的所有不同元素？

debugcn 发表于 Dev

9

克里斯考克

假设我有以下数据帧：

scala> val dataset = Seq((0, "hello"), (0, "world"), (0, "hello"), (1, "foo"), (1, "bar")).toDF("id", "text")
dataset: org.apache.spark.sql.DataFrame = [id: int, text: string]

scala> dataset.show()
+---+-----+
| id| text|
+---+-----+
|  0|hello|
|  0|world|
|  0|hello|
|  1|  foo|
|  1|  bar|
+---+-----+

我如何获得text每个的不同id？即，我想做类似的事情：

dataset.groupBy("id").agg(distinct('text))

我必须创建一个UserDefinedAggregateFunction吗？我最终想要每个id.

西多姆

您可以使用collect_set：

dataset.groupBy("id").agg(collect_set($"text")).show
+---+-----------------+
| id|collect_set(text)|
+---+-----------------+
|  1|       [bar, foo]|
|  0|   [world, hello]|
+---+-----------------+

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-10

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

如何在UIWebView中获取所有HTML元素

来自分类Dev

如何从指定值的字典中获取所有键？

来自分类Dev

如何从ArrayList <HashMap <String，String >>中获取所有元素

来自分类Dev

如何在每个容器中包装所有元素

来自分类Dev

获取轨道中每个不同记录的所有列

来自分类Dev

如何从哈希数组中获取键的所有值？

来自分类Dev

如何获取存储在向量中的索引处的所有元素？

来自分类Dev

如何从有序词典中获取所有键？

来自分类Dev

如何遍历并获取Firebase中嵌套节点的所有键？

来自分类Dev

如何从定界的列中获取所有不同的数据

来自分类Dev

如何从字典中获取所有键的字符串数组，以及如何以相同的方式修改每个字符串

来自分类Dev

如何使用Selenium从表中获取所有<tr>元素

来自分类Dev

从表A中获取表b中没有外键条目的所有元素

来自分类Dev

如何检查列表中的所有元素是否都不同

来自分类Dev

获取PCollection中的所有元素，而不管标记如何

来自分类Dev

如何使用BigQuery在没有每个元素的情况下获取所有总和值？

来自分类Dev

如何从反冲的atomFamily中获取所有元素？

来自分类Dev

如何使用XPath从根标签中获取所有不同的元素标签

来自分类Dev

获取所有可能的字符串序列，其中每个元素都来自R中的不同集合

来自分类Dev

如何从jquery中属于同一类的成员的元素中获取所有不同的值？

来自分类Dev

如何从ArrayList <HashMap <String，String >>中获取所有元素

来自分类Dev

如何在每个容器中包装所有元素

来自分类Dev

获取每个键的所有值

来自分类Dev

如何从选择器中获取所有元素包含的属性的每个值？

来自分类Dev

如何从对象列表中获取 n 元素的不同 TUPLES 的所有组合？

来自分类Dev

如何从表格中获取所有 tr 元素并单击链接？

来自分类Dev

Selenide：如何从 ElementsCollection 中获取所有活动元素？

来自分类Dev

如何从表单中获取所有选中的元素？

来自分类Dev

如何在 Ruby 中获取数组元素的所有组合？

Related 相关文章

文章

热门标签

归档