从`dataframe / Dataset`函数获得与SQL查询返回的结果相同的结果

鲍勃

数据 :

1,Coke
1,Beans
1,paper
2,Beans
2,Pen
2,Sheets
2,Banana

预期产量

+---+------------------------+
|  1|Coke,Beans,Paper        | 
|  2|Beans,Pen,Sheets,Banana |
+---+------------------------+

我可以通过编写sql查询来实现。

val df = sparkSession.read.csv("file_location")
df.registerTempTable("data")

val result = sparkSession
             .sql("select _c0   ,concat_ws(',', collect_list(_c1)) as product from data group by _c0")

result.show

请使用dataframe/Dataset功能(select,groupby,agg等)帮助我达到相同的结果

阿尔贝托·邦桑托(Alberto Bonsanto)

这很简单,您可以在这里找到答案,但是我希望我不仅仅是在做某种研究生作业。ADataFrame就像SQL表一样,因此您可以使用其方法查询它。

import org.apache.spark.sql.functions._

val df = sc.parallelize(List(
  (1, "Coke"),
  (1, "Beans"),
  (1,"paper"),
  (2,"Beans"),
  (2,"Pen"),
  (2,"Sheets"),
  (2,"Banana")
)).toDF("id", "product_name")

df.groupBy("id").agg(concat_ws(",", collect_list("product_name")).as("product_list")).show()

输出为:

+---+-----------------------+
|id |product_list           |
+---+-----------------------+
|1  |Coke,Beans,paper       |
|2  |Beans,Pen,Sheets,Banana|
+---+-----------------------+

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从`dataframe / Dataset`函数获得与SQL查询返回的结果相同的结果

来自分类Dev

获得与“ by”函数相同的结果,但取向量

来自分类Dev

在DataFrame上执行操作,并获得与Pandas中另一个DataFrame中存在的条件匹配的DataFrame结果

来自分类Dev

通过join获得与子查询相同的结果

来自分类Dev

在BigQuery中,我希望获得与pl / sql中的listagg函数相同的结果。我该怎么做。

来自分类Dev

在glm中使用什么函数来获得与此函数相同的结果

来自分类Dev

Spark SQL查询与DataFrame函数

来自分类Dev

从ElasticSearch结果创建DataFrame

来自分类Dev

Matplotlib Specgram获得与Matlab中相同的结果

来自分类Dev

Python (+SymPy):如何获得与 Mathematica 相同的结果?

来自分类Dev

SQL:如何组合两个查询并获得相同的结果?

来自分类Dev

如何将BigQuery SQL查询结果转换为Spark DataFrame?

来自分类Dev

如何获得函数返回结果?

来自分类Dev

JCR_SQL2如何获得与众不同的结果

来自分类Dev

Pandas 获得与 SQL 语句相同结果的 Pythonic 方式是什么:“UPDATE-LEFT JOIN - SET - WHERE”?

来自分类Dev

提高24小时返回相同结果的SQL查询的性能

来自分类Dev

SQL查询-多个COUNT返回错误(相同)结果

来自分类Dev

从函数查询返回数组结果

来自分类Dev

Pandas Dataframe问题:Apply函数用结果添加新列

来自分类Dev

从PHP查询中获得相同的错误结果

来自分类Dev

Powershell-如果SQL查询返回结果,则运行函数

来自分类Dev

SQL查询返回错误结果

来自分类Dev

SQL查询返回错误的结果

来自分类Dev

SQL 查询返回多个结果

来自分类Dev

获得与jQuery .filter()相反的结果

来自分类Dev

如何使用spark / scala像show()对dataframe那样显示来自列函数的结果结果

来自分类Dev

如何使用spark / scala像show()对dataframe那样显示来自列函数的结果结果

来自分类Dev

相同的查询,getResult与getArrayResult返回不同的结果

来自分类Dev

相同的查询返回不同的结果(MySQL Group By)

Related 相关文章

  1. 1

    从`dataframe / Dataset`函数获得与SQL查询返回的结果相同的结果

  2. 2

    获得与“ by”函数相同的结果,但取向量

  3. 3

    在DataFrame上执行操作,并获得与Pandas中另一个DataFrame中存在的条件匹配的DataFrame结果

  4. 4

    通过join获得与子查询相同的结果

  5. 5

    在BigQuery中,我希望获得与pl / sql中的listagg函数相同的结果。我该怎么做。

  6. 6

    在glm中使用什么函数来获得与此函数相同的结果

  7. 7

    Spark SQL查询与DataFrame函数

  8. 8

    从ElasticSearch结果创建DataFrame

  9. 9

    Matplotlib Specgram获得与Matlab中相同的结果

  10. 10

    Python (+SymPy):如何获得与 Mathematica 相同的结果?

  11. 11

    SQL:如何组合两个查询并获得相同的结果?

  12. 12

    如何将BigQuery SQL查询结果转换为Spark DataFrame?

  13. 13

    如何获得函数返回结果?

  14. 14

    JCR_SQL2如何获得与众不同的结果

  15. 15

    Pandas 获得与 SQL 语句相同结果的 Pythonic 方式是什么:“UPDATE-LEFT JOIN - SET - WHERE”?

  16. 16

    提高24小时返回相同结果的SQL查询的性能

  17. 17

    SQL查询-多个COUNT返回错误(相同)结果

  18. 18

    从函数查询返回数组结果

  19. 19

    Pandas Dataframe问题:Apply函数用结果添加新列

  20. 20

    从PHP查询中获得相同的错误结果

  21. 21

    Powershell-如果SQL查询返回结果,则运行函数

  22. 22

    SQL查询返回错误结果

  23. 23

    SQL查询返回错误的结果

  24. 24

    SQL 查询返回多个结果

  25. 25

    获得与jQuery .filter()相反的结果

  26. 26

    如何使用spark / scala像show()对dataframe那样显示来自列函数的结果结果

  27. 27

    如何使用spark / scala像show()对dataframe那样显示来自列函数的结果结果

  28. 28

    相同的查询,getResult与getArrayResult返回不同的结果

  29. 29

    相同的查询返回不同的结果(MySQL Group By)

热门标签

归档