Spark SQL - 在 Spark Streams 上部署 SQL 查询的选项

debugcn 发表于 Dev

千斤顶

我是 Spark 的新手，想通过 Spark 流运行 Spark SQL 查询。

我目前的理解是，我需要在我的 Spark 作业的代码中定义我的 SQL 查询，因为从 Spark SQ 主页提取的这个片段显示：-

spark.read.json("s3n://...")
  .registerTempTable("json")
results = spark.sql(
  """SELECT * 
     FROM people
     JOIN json ...""")

我想要做的是在某处自己定义我的查询 - 例如。.sql 文件 - 然后将其部署在 Spark 集群上。

谁能告诉我 Spark 目前是否支持这种架构？例如。一些API？

什里尼瓦斯·德什穆克

您可以使用 python 和 open 来满足您的目的：

with open('filepath/filename.sql') as fr:
    query = fr.read()
x = spark.sql(query)
x.show(5)

你可以filename.sql在提交你的工作时作为参数传递使用sys.argv[]

请参阅此链接以获取更多帮助：Spark SQL 问题

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-20

我来说两句

0条评论

登录后参与评论

来自分类Dev

在 sql spark 中查询

来自分类Dev

Spark SQL查询与DataFrame函数

来自分类Dev

在Spark SQL中更新查询

来自分类Dev

在Spark SQL中更新查询

来自分类Dev

Spark Streaming + Spark SQL

来自分类Dev

Spark Streaming + Spark SQL

来自分类Dev

在Heroku上部署Apache Spark

来自分类Dev

在Heroku上部署Apache Spark

来自分类Dev

从Spark SQL生成SQL

来自分类Dev

内置的Spark转换是否比Spark SQL查询更快？

来自分类Dev

查询：Spark SQL中的Beeline接口

来自分类Dev

从SQL查询创建Spark数据框

来自分类Dev

从Spark sql jdbc语句取消查询

来自分类Dev

在数组内部的Spark SQL中查询

来自分类Dev

如何使用Spark Sql进行递归查询

来自分类Dev

Spark SQL传递变量进行查询

来自分类Dev

Spark SQL查询到熊猫问题

来自分类Dev

在Spark SQL查询中使用Scala列表

来自分类Dev

从Spark Scala查询SQL Server-如何？

来自分类Dev

spark SQL scala DSL 子查询支持

来自分类Dev

Spark SQL 查询 Group By 值后跟列表

来自分类Dev

不使用first（）的Spark SQL与普通SQL查询错误

来自分类Dev

查询SQL Server表时出现Spark SQL错误

来自分类Dev

Spark SQL中的SQL宏

来自分类Dev

Spark SQL：更改表

来自分类Dev

Spark SQL堆栈溢出

来自分类Dev

SQL over Spark流

来自分类Dev

Spark SQL性能

来自分类Dev

Spark SQL中的PATINDEX

Related 相关文章

文章