如何在Pyspark中的多个列上联接?

用户名

我正在使用Spark 1.3,并希望使用python接口(SparkSQL)加入多个列

以下作品:

我首先将它们注册为临时表。

numeric.registerTempTable("numeric")
Ref.registerTempTable("Ref")

test  = numeric.join(Ref, numeric.ID == Ref.ID, joinType='inner')

我现在想基于多个列将它们加入。

我得到SyntaxError:与此无效的语法:

test  = numeric.join(Ref,
   numeric.ID == Ref.ID AND numeric.TYPE == Ref.TYPE AND
   numeric.STATUS == Ref.STATUS ,  joinType='inner')
零323

您应该使用&/|运算符,并注意运算符的优先级==其优先级低于按位ANDOR):

df1 = sqlContext.createDataFrame(
    [(1, "a", 2.0), (2, "b", 3.0), (3, "c", 3.0)],
    ("x1", "x2", "x3"))

df2 = sqlContext.createDataFrame(
    [(1, "f", -1.0), (2, "b", 0.0)], ("x1", "x2", "x3"))

df = df1.join(df2, (df1.x1 == df2.x1) & (df1.x2 == df2.x2))
df.show()

## +---+---+---+---+---+---+
## | x1| x2| x3| x1| x2| x3|
## +---+---+---+---+---+---+
## |  2|  b|3.0|  2|  b|0.0|
## +---+---+---+---+---+---+

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

列数未知时如何在多列上联接两个表(pyspark)

来自分类Dev

如何在CakePHP 3的多个列上联接两个表?

来自分类Dev

在SQL Server中的两列上联接

来自分类Dev

在Python Pandas中,如何在datetime列上联接由periodindex索引的另一个数据框?

来自分类Dev

在选定的列上联接

来自分类Dev

Rails查询-如何在特定列上联接两个表

来自分类Dev

在一个特定列上联接多个表

来自分类Dev

在两列上联接表

来自分类Dev

在两列上联接表

来自分类Dev

如何在条件表上联接

来自分类Dev

如何在理论中的同一列上实现对多个表的联接

来自分类Dev

如何在一个“表”的同一自动生成的整数上联接多个表?

来自分类Dev

熊猫:在选定列上联接数据框

来自分类Dev

Codeigniter数据库在基于多个值的两列上联接

来自分类Dev

在Oracle DBMS的多个列上联接具有过滤条件的表

来自分类Dev

在Oracle DBMS的多个列上联接具有过滤条件的表

来自分类Dev

MySQL在公共列上联接多个表,没有重要性顺序

来自分类Dev

Codeigniter数据库在基于多个值的两列上联接

来自分类Dev

SQL Server中多个列上的内部联接

来自分类Dev

如何在两个字段上联接表并从两个匹配结果中检索单个列?

来自分类Dev

mongoDB在多个字段上联接

来自分类Dev

在2列上联接3个表?

来自分类Dev

需要在不同列上联接3个表

来自分类Dev

更改子查询以在Oracle视图中的两列上联接

来自分类Dev

在一列上联接并返回不相互的记录

来自分类Dev

Codeigniter SQL查询在两个不同的列上联接

来自分类Dev

在2列上联接3个表?

来自分类Dev

SQL在具有不同格式的两列上联接

来自分类Dev

Django在多个外部字段上联接(左联接)

Related 相关文章

热门标签

归档