所以,假设我有以下两个 RDDS:(这些只是每个 RDD 的前几行)
RDD1:
Time Temp
2014-08-12 13:20:00 22
2014-08-12 13:21:00 24
2014-08-12 13:24:00 26
2014-08-12 13:26:00 27
2014-08-12 13:28:00 22
RDD2:
Time Age
2014-08-12 13:20:00 45
2014-08-12 13:21:00 45
2014-08-12 13:24:00 46
2014-08-12 13:26:00 37
2014-08-12 13:28:00 122
我想将它们组合起来,以便将 RDD2 列添加到 RDD1。我不能使用联合,因为这只会将 RDD2 添加到 RDD1 的底部,而如果有意义的话,我想将它添加到“侧面”。
join
会让你加入这些RDD
“并排”。从文档:
"当调用类型为 (K, V) 和 (K, W) 的数据集时,返回一个 (K, (V, W)) 对的数据集,其中包含每个键的所有元素对。通过 leftOuterJoin、rightOuterJoin 支持外连接, 和 fullOuterJoin。 ”
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句