在pySpark中将RDD拆分为n个部分

贾斯旺特

我想使用Pyspark将RDD分成相等长度的n个部分

如果RDD是这样的

data = range(0,20)
d_rdd = sc.parallelize(data)
d_rdd.glom().collect()
[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [10, 11, 12, 13, 14, 15, 16, 17, 18, 19]]

我想将任意两个随机数组合在一起,例如

[[0,4],[6,11],[5,18],[3,14],[17,9],[12,8],[2,10],[1,15],[13,19],[7,16]]
yanghaogn

两种方法:

在使用parallelize时设置分区num ,并使用功能distinct()

data = range(0,20)
d_rdd = sc.parallelize(data, 10).distinct()
d_rdd.glom().collect()

使用repartition()distinct()

data = range(0,20)
d_rdd = sc.parallelize(data).repartition(10).distinct()
d_rdd.glom().collect()

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在 perl 中将数组拆分为 n 个可访问的部分?

来自分类Dev

如何将数组拆分为n个部分?

来自分类Dev

如何将字典拆分为“ n”个部分

来自分类Dev

如何将字典拆分为“ n”个部分

来自分类Dev

在C ++中将间隔分为n个相等的部分

来自分类Dev

在R中将字符串拆分为100个单词部分

来自分类Dev

如何在C#中将列表拆分为多个部分?

来自分类Dev

在 SELECT 语句中将名称拆分为多个部分

来自分类Dev

如何在R中将字符串变量拆分为n个变量

来自分类Dev

将RDD中的元组拆分为两个元组

来自分类Dev

将 100 个数字拆分为 N 个相同长度的部分

来自分类Dev

pyspark rdd拆分问题

来自分类Dev

在PHP中将字符串拆分为2个变量

来自分类Dev

在python中将一个csv拆分为多个文件

来自分类Dev

在Reportlab中将表格拆分为1个以上的页面

来自分类Dev

在python中将数组拆分为两个较小的数组

来自分类Dev

在C中将数组拆分为两个

来自分类Dev

如何在 Oracle SQL 中将分隔字符串拆分为 n(n-1)/2 个组合?

来自分类Dev

Swift 将 TableView 拆分为两个部分

来自分类Dev

如何在python中将字符串拆分为每个部分仅包含相同字符的部分

来自分类Dev

将字典随机分为n个部分

来自分类Dev

在Spark中将一个RDD严格划分为多个RDD

来自分类Dev

将列拆分为部分

来自分类Dev

将一个拆分器拆分为N个拆分器

来自分类Dev

将一个拆分器拆分为N个拆分器

来自分类Dev

如何在python中将字符串拆分为多个部分?

来自分类Dev

如何在Linux Bash / Shell中将字符串拆分为组成部分

来自分类Dev

在 C 中将字符数组拆分为多个部分:意外行为

来自分类Dev

将字符串拆分为n个长度的数组

Related 相关文章

热门标签

归档