如何获取DataFrame中每个键的所有不同元素?

克里斯考克

假设我有以下数据帧:

scala> val dataset = Seq((0, "hello"), (0, "world"), (0, "hello"), (1, "foo"), (1, "bar")).toDF("id", "text")
dataset: org.apache.spark.sql.DataFrame = [id: int, text: string]

scala> dataset.show()
+---+-----+
| id| text|
+---+-----+
|  0|hello|
|  0|world|
|  0|hello|
|  1|  foo|
|  1|  bar|
+---+-----+

我如何获得text每个的不同id即,我想做类似的事情:

dataset.groupBy("id").agg(distinct('text))

我必须创建一个UserDefinedAggregateFunction吗?我最终想要每个id.

西多姆

您可以使用collect_set

dataset.groupBy("id").agg(collect_set($"text")).show
+---+-----------------+
| id|collect_set(text)|
+---+-----------------+
|  1|       [bar, foo]|
|  0|   [world, hello]|
+---+-----------------+

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在UIWebView中获取所有HTML元素

来自分类Dev

如何从指定值的字典中获取所有键?

来自分类Dev

如何从ArrayList <HashMap <String,String >>中获取所有元素

来自分类Dev

如何在每个容器中包装所有元素

来自分类Dev

获取轨道中每个不同记录的所有列

来自分类Dev

如何从哈希数组中获取键的所有值?

来自分类Dev

如何获取存储在向量中的索引处的所有元素?

来自分类Dev

如何从有序词典中获取所有键?

来自分类Dev

如何遍历并获取Firebase中嵌套节点的所有键?

来自分类Dev

如何从定界的列中获取所有不同的数据

来自分类Dev

如何从字典中获取所有键的字符串数组,以及如何以相同的方式修改每个字符串

来自分类Dev

如何使用Selenium从表中获取所有<tr>元素

来自分类Dev

从表A中获取表b中没有外键条目的所有元素

来自分类Dev

如何检查列表中的所有元素是否都不同

来自分类Dev

获取PCollection中的所有元素,而不管标记如何

来自分类Dev

如何使用BigQuery在没有每个元素的情况下获取所有总和值?

来自分类Dev

如何从反冲的atomFamily中获取所有元素?

来自分类Dev

如何使用XPath从根标签中获取所有不同的元素标签

来自分类Dev

获取所有可能的字符串序列,其中每个元素都来自R中的不同集合

来自分类Dev

如何从jquery中属于同一类的成员的元素中获取所有不同的值?

来自分类Dev

如何从ArrayList <HashMap <String,String >>中获取所有元素

来自分类Dev

如何在每个容器中包装所有元素

来自分类Dev

获取每个键的所有值

来自分类Dev

如何从选择器中获取所有元素包含的属性的每个值?

来自分类Dev

如何从对象列表中获取 n 元素的不同 TUPLES 的所有组合?

来自分类Dev

如何从表格中获取所有 tr 元素并单击链接?

来自分类Dev

Selenide:如何从 ElementsCollection 中获取所有活动元素?

来自分类Dev

如何从表单中获取所有选中的元素?

来自分类Dev

如何在 Ruby 中获取数组元素的所有组合?

Related 相关文章

  1. 1

    如何在UIWebView中获取所有HTML元素

  2. 2

    如何从指定值的字典中获取所有键?

  3. 3

    如何从ArrayList <HashMap <String,String >>中获取所有元素

  4. 4

    如何在每个容器中包装所有元素

  5. 5

    获取轨道中每个不同记录的所有列

  6. 6

    如何从哈希数组中获取键的所有值?

  7. 7

    如何获取存储在向量中的索引处的所有元素?

  8. 8

    如何从有序词典中获取所有键?

  9. 9

    如何遍历并获取Firebase中嵌套节点的所有键?

  10. 10

    如何从定界的列中获取所有不同的数据

  11. 11

    如何从字典中获取所有键的字符串数组,以及如何以相同的方式修改每个字符串

  12. 12

    如何使用Selenium从表中获取所有<tr>元素

  13. 13

    从表A中获取表b中没有外键条目的所有元素

  14. 14

    如何检查列表中的所有元素是否都不同

  15. 15

    获取PCollection中的所有元素,而不管标记如何

  16. 16

    如何使用BigQuery在没有每个元素的情况下获取所有总和值?

  17. 17

    如何从反冲的atomFamily中获取所有元素?

  18. 18

    如何使用XPath从根标签中获取所有不同的元素标签

  19. 19

    获取所有可能的字符串序列,其中每个元素都来自R中的不同集合

  20. 20

    如何从jquery中属于同一类的成员的元素中获取所有不同的值?

  21. 21

    如何从ArrayList <HashMap <String,String >>中获取所有元素

  22. 22

    如何在每个容器中包装所有元素

  23. 23

    获取每个键的所有值

  24. 24

    如何从选择器中获取所有元素包含的属性的每个值?

  25. 25

    如何从对象列表中获取 n 元素的不同 TUPLES 的所有组合?

  26. 26

    如何从表格中获取所有 tr 元素并单击链接?

  27. 27

    Selenide:如何从 ElementsCollection 中获取所有活动元素?

  28. 28

    如何从表单中获取所有选中的元素?

  29. 29

    如何在 Ruby 中获取数组元素的所有组合?

热门标签

归档