如何在PySpark中运行.sql文件

胶衣匠

我可以使用PySpark运行单个SQL查询。例如

spark = SparkSession.builder.appNmae("___").getOrCreate()
df = spark.sql("select * from ...")

但是我有一个.sql文件,其中包含许多我想运行的查询。我是否必须一次执行一次,还是有一种简单的方法可以运行所有这些程序?

示例:表1中有3行,3列,表2中相同

.sql文件

select * from table1;

select * from table2;

输出df:

   A  B  C
0  1  2  3
1  4  5  6
2  7  8  9
3  a  b  c
4  d  e  f
5  g  h  i

要么

df1

   A  B  C
0  1  2  3
1  4  5  6
2  7  8  9

和df2

   A  B  C
0  a  b  c
1  d  e  f
2  g  h  i
麦克

如果要将所有查询结果合并到数据帧列表中(假设每一行都是一个查询)

with open('/path/to/file.sql', 'r') as f:
    query = f.readlines()

dfs = []
for line in query:
    dfs.append(spark.sql(line))

如果要合并所有数据框(假设它们都具有相同的架构)

from functools import reduce

df = reduce(lambda x, y: x.union(y), dfs)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Dockerfile中的SQL映像内运行.sql文件?

来自分类Dev

Docker,如何在映像中运行.sql文件?

来自分类Dev

如何在PHPMyAdmin中运行大型SQL文件

来自分类Dev

如何在MySQL Workbench 6.2查询中运行.sql文件?

来自分类Dev

如何在MySQL中运行多个文件.sql?

来自分类Dev

如何在PostgreSQL 9.2.6 + CentO中执行/运行.sql文件

来自分类Dev

如何在PySpark中读取Avro文件

来自分类Dev

如何在Gulp中运行外部文件?

来自分类Dev

如何在Python中运行.exe文件

来自分类Dev

如何在C ++中运行Python文件?

来自分类Dev

如何在ubuntu中运行.exe文件?

来自分类Dev

如何在PyCharm中运行Scratch文件?

来自分类Dev

如何在python中运行多个文件

来自分类Dev

如何在ubuntu中运行.exe文件?

来自分类Dev

如何在cmd中运行python文件?

来自分类Dev

如何在 phar 中运行 php 文件?

来自分类Dev

如何在 SQL Server 中使用 bcp 运行 .sql 文件

来自分类Dev

如何在Solr中运行SQL查询

来自分类Dev

如何在Shell脚本中运行SQL

来自分类Dev

如何在Shell脚本中运行SQL

来自分类Dev

如何在 php 中运行 sql 查询?

来自分类Dev

如何在Java中运行.sql脚本(从文件)并使用Spring返回ResultSet?

来自分类Dev

如何在MySql Workbench中运行sql文件而不加载它?

来自分类Dev

如何在MySql Workbench中运行sql文件而不加载它?

来自分类Dev

如何在Java中运行.sql脚本(从文件)并使用Spring返回ResultSet?

来自分类Dev

如何在pymssql中执行.sql文件

来自分类Dev

如何在sql中引用外部文件?

来自分类Dev

如何在pyspark数据框中读取protoBuffer .pb文件?

来自分类Dev

如何在Pyspark中读取多行CSV文件

Related 相关文章

热门标签

归档