搜索

搜索

使用Spark并行处理集合

Kiril 发表于 Dev

3

基里尔

我正在尝试使用Spark并行处理一个集合，并且文档中的示例似乎不起作用：

List<Integer> data = Arrays.asList(1, 2, 3, 4, 5);
JavaRDD<Integer> distData = sc.parallelize(data);

我正在LabeledPoint从记录创建s列表，每个记录包含数据点（double[]）和标签（默认值：true / false）。

 public List<LabeledPoint> createLabeledPoints(List<ESRecord> records) {
    List<LabeledPoint> points = new ArrayList<>();

    for (ESRecord rec : records) {

        points.add(new LabeledPoint(
                rec.defaulted ? 1.0 : 0.0, Vectors.dense(rec.toDataPoints())));
    }
    return points;
}

public void test(List<ESRecord> records) {
    SparkConf conf = new SparkConf().setAppName("SVM Classifier Example");
    SparkContext sc = new SparkContext(conf);
    List<LabeledPoint> points = createLabeledPoints(records);        
    JavaRDD<LabeledPoint> data = sc.parallelize(points);
    ...
 }

并行化的功能签名不再采用一个参数，这是它在spark-mllib_2.11 v1.3.0中的外观： sc.parallelize(seq, numSlices, evidence$1)

那么关于如何使它起作用的任何想法？

ale64位

在Java中，您应该使用JavaSparkContext。

https://spark.apache.org/docs/0.6.2/api/core/spark/api/java/JavaSparkContext.html

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

0

我来说两句

0条评论

登录后参与评论

上一篇：从lm对象中提取因变量

相关文章

来自分类Dev

并行处理Java集合

来自分类Dev

Spark并行处理分组数据

来自分类Dev

在 spark scala shell 中并行化集合

来自分类Dev

选择Akka还是Spark进行并行处理？

来自分类Dev

Spark：并行处理多个Kafka主题

来自分类Dev

使用python并行处理函数

来自分类Dev

使用GCD并行处理阵列

来自分类Dev

使用LINQ的并行csv处理

来自分类Dev

使用并行处理的SQL连接

来自分类Dev

使用xargs进行并行处理

来自分类Dev

使用OpenMP进行集合的高效并行并集

来自分类Dev

使用多处理池的并行处理循环

来自分类Dev

使用“并行”包在R中进行并行处理

来自分类Dev

如何使用PLINQ并行处理周期？

来自分类Dev

R：使用doParallel并行处理几行

来自分类Dev

在R中使用雪进行并行处理

来自分类Dev

使用openMP并行处理主要查找器

来自分类Dev

在Java中使用线程进行并行处理

来自分类Dev

使用Azure-SB的并行消息处理

来自分类Dev

在python中使用Pygame进行并行处理

来自分类Dev

在Java中使用线程进行并行处理

来自分类Dev

如何使用PLINQ并行处理周期？

来自分类Dev

如何使用openMP并行处理内部循环？

来自分类Dev

使用 Python 类对象并行处理

来自分类Dev

使用 R 并行处理 XML 节点

来自分类Dev

在 Julia 中使用 DataFrames 进行并行处理

来自分类Dev

如何在Eclipse中并行运行Spark处理？

来自分类Dev

如何在Eclipse中并行运行Spark处理？

来自分类Dev

当我并行处理大型列表时，Spark Context关闭

Related 相关文章

文章

热门标签

归档