搜索

搜索

从`dataframe / Dataset`函数获得与SQL查询返回的结果相同的结果

Bob 发表于 Dev

19

鲍勃

数据：

1,Coke
1,Beans
1,paper
2,Beans
2,Pen
2,Sheets
2,Banana

预期产量：

+---+------------------------+
|  1|Coke,Beans,Paper        | 
|  2|Beans,Pen,Sheets,Banana |
+---+------------------------+

我可以通过编写sql查询来实现。

val df = sparkSession.read.csv("file_location")
df.registerTempTable("data")

val result = sparkSession
             .sql("select _c0   ,concat_ws(',', collect_list(_c1)) as product from data group by _c0")

result.show

请使用dataframe/Dataset功能（select，groupby，agg等）帮助我达到相同的结果。

阿尔贝托·邦桑托（Alberto Bonsanto）

这很简单，您可以在这里找到答案，但是我希望我不仅仅是在做某种研究生作业。ADataFrame就像SQL表一样，因此您可以使用其方法查询它。

import org.apache.spark.sql.functions._

val df = sc.parallelize(List(
  (1, "Coke"),
  (1, "Beans"),
  (1,"paper"),
  (2,"Beans"),
  (2,"Pen"),
  (2,"Sheets"),
  (2,"Banana")
)).toDF("id", "product_name")

df.groupBy("id").agg(concat_ws(",", collect_list("product_name")).as("product_list")).show()

输出为：

+---+-----------------------+
|id |product_list           |
+---+-----------------------+
|1  |Coke,Beans,paper       |
|2  |Beans,Pen,Sheets,Banana|
+---+-----------------------+

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-4

0

我来说两句

0条评论

登录后参与评论

上一篇：Locals窗口为空（Visual Studio 2015）

相关文章

来自分类Dev

从`dataframe / Dataset`函数获得与SQL查询返回的结果相同的结果

来自分类Dev

获得与“ by”函数相同的结果，但取向量

来自分类Dev

在DataFrame上执行操作，并获得与Pandas中另一个DataFrame中存在的条件匹配的DataFrame结果

来自分类Dev

通过join获得与子查询相同的结果

来自分类Dev

在BigQuery中，我希望获得与pl / sql中的listagg函数相同的结果。我该怎么做。

来自分类Dev

在glm中使用什么函数来获得与此函数相同的结果

来自分类Dev

Spark SQL查询与DataFrame函数

来自分类Dev

从ElasticSearch结果创建DataFrame

来自分类Dev

Matplotlib Specgram获得与Matlab中相同的结果

来自分类Dev

Python (+SymPy)：如何获得与 Mathematica 相同的结果？

来自分类Dev

SQL：如何组合两个查询并获得相同的结果？

来自分类Dev

如何将BigQuery SQL查询结果转换为Spark DataFrame？

来自分类Dev

如何获得函数返回结果？

来自分类Dev

JCR_SQL2如何获得与众不同的结果

来自分类Dev

Pandas 获得与 SQL 语句相同结果的 Pythonic 方式是什么：“UPDATE-LEFT JOIN - SET - WHERE”？

来自分类Dev

提高24小时返回相同结果的SQL查询的性能

来自分类Dev

SQL查询-多个COUNT返回错误（相同）结果

来自分类Dev

从函数查询返回数组结果

来自分类Dev

Pandas Dataframe问题：Apply函数用结果添加新列

来自分类Dev

从PHP查询中获得相同的错误结果

来自分类Dev

Powershell-如果SQL查询返回结果，则运行函数

来自分类Dev

SQL查询返回错误结果

来自分类Dev

SQL查询返回错误的结果

来自分类Dev

SQL 查询返回多个结果

来自分类Dev

获得与jQuery .filter（）相反的结果

来自分类Dev

如何使用spark / scala像show（）对dataframe那样显示来自列函数的结果结果

来自分类Dev

如何使用spark / scala像show（）对dataframe那样显示来自列函数的结果结果

来自分类Dev

相同的查询，getResult与getArrayResult返回不同的结果

来自分类Dev

相同的查询返回不同的结果（MySQL Group By）

Related 相关文章

文章

热门标签

归档