如何使用Java在SPARK中使用地图功能

前卫新手

我尝试在spark中读取一个csv文件,并且我想分割以逗号分隔的行,以便具有带二维数组的RDD。我是Spark的新手。

我尝试这样做:

public class SimpleApp 
{   
    public static void main(String[] args) throws Exception 
    {       
        String master = "local[2]";
        String csvInput = "/home/userName/Downloads/countrylist.csv";
        String csvOutput = "/home/userName/Downloads/countrylist";

        JavaSparkContext sc = new JavaSparkContext(master, "loadwholecsv", System.getenv("SPARK_HOME"), System.getenv("JARS"));

        JavaRDD<String> csvData = sc.textFile(csvInput, 1);
        JavaRDD<String> words = csvData.map(new Function <List<String>>() { //line 43
              @Override
              public List<String> call(String s) {
                return Arrays.asList(s.split("\\s*,\\s*"));
              }
            });

        words.saveAsTextFile(csvOutput);
    }
}

这应该分割行并返回ArrayList。但我对此不确定。我收到此错误:

SimpleApp.java:[43,58] wrong number of type arguments; required 2
霍尔顿

因此,该程序存在两个小问题。首先,您可能希望使用flatMap而不是map,因为您尝试返回单词的RDD而不是单词列表的RDD,所以我们可以使用flatMap来使结果平坦。另一个是,我们的函数类还需要调用它的输入的类型。我将JavaRDD单词替换为:

JavaRDD<String> words = rdd.flatMap(
  new FlatMapFunction<String, String>() { public Iterable<String> call(String s) {
      return Arrays.asList(s.split("\\s*,\\s*"));
    }});

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在javascript中使用地图功能

来自分类Dev

如何在Clojure中使用地图功能?

来自分类Dev

如何使用地图功能jquery?

来自分类Dev

如何使用地图功能附加到列表?

来自分类Dev

如何在功能中使用地图

来自分类Dev

如何在Spark Java中对数据集应用地图功能

来自分类Dev

在React Native中使用地图功能时未显示图像

来自分类Dev

Scala中的异构列表;使用地图功能

来自分类Dev

快速使用地图功能制作MKPointAnnotations

来自分类Dev

反应挂钩:无法使用地图功能创建列表

来自分类Dev

使用地图功能更改数据框的编码

来自分类Dev

使用数据框调用地图功能

来自分类Dev

Scala中的异构列表;使用地图功能

来自分类Dev

X使用地图功能Haskell获取许多值

来自分类Dev

使用地图功能的语法错误

来自分类Dev

单选按钮选择问题,同时使用地图功能

来自分类Dev

使用地图功能时如何更新一个特定元素的状态

来自分类Dev

如何使用地图功能python在2D列表中平方每个元素

来自分类Dev

我无法使用地图功能TypeError:无法读取未定义的属性“地图”

来自分类Dev

使用地图功能时如何将每个状态动态绑定到每个复选框

来自分类Dev

是否可以在 PouchDB 地图功能中使用 lodash?

来自分类Dev

如何在urljoin中使用地图?

来自分类Dev

使用地图功能从Google趋势数据创建数据框

来自分类Dev

使用地图功能时,Tensorflow tf.data.Dataset错误 KeyError

来自分类Dev

我可以使用地图功能执行此操作吗?

来自分类Dev

Dispatch Action、React + Redux 后无法使用地图功能

来自分类Dev

如何在Scala中使用是否要过滤地图功能?

来自分类Dev

使用地图撰写功能

来自分类Dev

如何使用带有随机数的地图功能

Related 相关文章

热门标签

归档