如何在Hadoop Reduce中获取当前文件名

Praveen Kumar Purushothaman

我正在使用WordCount示例,并且在Reduce函数中,我需要获取文件名。

public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable, Text, IntWritable> {
  public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text, IntWritable> output, Reporter reporter) throws IOException {
    int sum = 0;
    while (values.hasNext()) {
      sum += values.next().get();
    }
    String filename = ((FileSplit)(.getContext()).getInputSplit()).getPath().getName();
    // ----------------------------^ I need to get the context and filename!
    key.set(key.toString() + " (" + filename + ")");
    output.collect(key, new IntWritable(sum));
  }
}

这是当前上面修改的代码,我想在其中获取要为该单词打印的文件名。我尝试了以下Java Hadoop:如何创建作为输入文件并提供输出(每个文件中的行数)的映射器?但我无法得到context物体。

我是hadoop的新手,需要此帮助。有帮助吗?

唐纳德·迈纳

您无法获得context,因为它context是“新API”的构造,并且您正在使用“旧API”。

请改用以下字数示例:http : //wiki.apache.org/hadoop/WordCount

在这种情况下,请参见reduce函数的签名:

public void reduce(Text key, Iterable<IntWritable> values, Context context) 

看到!上下文!请注意,在此示例中,它是从而.mapreduce.不是从导入.mapred.

对于新的hadoop用户而言,这是一个常见问题,因此不要感到难过。通常,出于多种原因,您希望使用新的API。但是,请务必小心找到的示例。另外,请认识到新的API和旧的API不可互操作(例如,您不能拥有新的API映射器和旧的API Reducer)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Dojo中获取当前文件名

来自分类Dev

如何在Perl单行代码中获取当前文件的文件名?

来自分类Dev

如何在Excel中插入当前文件名?

来自分类Dev

如何在vim中不断查看当前文件名?

来自分类Dev

如何在管道命令中多次使用当前文件名?

来自分类Dev

如何在Kotlin中获取当前类的文件名

来自分类Dev

如果我有一个在另一个 php 文件中执行此操作的函数,如何获取当前文件的文件名?

来自分类Dev

hadoop map reduce程序中如何在映射器代码中获取输入文件名

来自分类Dev

如何将当前文件名插入Vim中的内容?

来自分类Dev

如何在Ruby中获取当前文件和行号?

来自分类Dev

如何在Google脚本中获取当前文件的名称?

来自分类Dev

如何在Python中获取当前目录中的所有文件名和文件大小

来自分类常见问题

在gulp.src()中获取当前文件名

来自分类Dev

在Babel插件中获取当前文件名?

来自分类Dev

在Gulp Stream中获取当前文件名

来自分类Dev

我如何在python dm-script中获取当前文件路径

来自分类Dev

如何在IArgumentCompleter的C#实现中获取当前文件系统位置?

来自分类Dev

如何在 Chapel 中获取当前文件、模块和过程的名称

来自分类Dev

如何获取当前文件的父级?

来自分类Dev

如何在Perl中从文件名获取文件句柄?

来自分类Dev

如何在 PHP 中获取当前服务器路径、url 域、文件名或脚本名称

来自分类Dev

如何获取当前正在运行的进程的文件名?

来自分类Dev

在Emacs中,如何在Finder中显示当前文件?

来自分类Dev

如何在QGridLayout中获取QComboBox的当前文本?

来自分类Dev

如何在python中获取Windows短文件名?

来自分类Dev

如何在Mocha Reporter中获取测试文件名

来自分类Dev

如何在Django中获取上传的文件名

来自分类Dev

如何在Bash中获取文件名的通配符部分

来自分类Dev

如何在Openerp中获取上载的文件名

Related 相关文章

  1. 1

    如何在Dojo中获取当前文件名

  2. 2

    如何在Perl单行代码中获取当前文件的文件名?

  3. 3

    如何在Excel中插入当前文件名?

  4. 4

    如何在vim中不断查看当前文件名?

  5. 5

    如何在管道命令中多次使用当前文件名?

  6. 6

    如何在Kotlin中获取当前类的文件名

  7. 7

    如果我有一个在另一个 php 文件中执行此操作的函数,如何获取当前文件的文件名?

  8. 8

    hadoop map reduce程序中如何在映射器代码中获取输入文件名

  9. 9

    如何将当前文件名插入Vim中的内容?

  10. 10

    如何在Ruby中获取当前文件和行号?

  11. 11

    如何在Google脚本中获取当前文件的名称?

  12. 12

    如何在Python中获取当前目录中的所有文件名和文件大小

  13. 13

    在gulp.src()中获取当前文件名

  14. 14

    在Babel插件中获取当前文件名?

  15. 15

    在Gulp Stream中获取当前文件名

  16. 16

    我如何在python dm-script中获取当前文件路径

  17. 17

    如何在IArgumentCompleter的C#实现中获取当前文件系统位置?

  18. 18

    如何在 Chapel 中获取当前文件、模块和过程的名称

  19. 19

    如何获取当前文件的父级?

  20. 20

    如何在Perl中从文件名获取文件句柄?

  21. 21

    如何在 PHP 中获取当前服务器路径、url 域、文件名或脚本名称

  22. 22

    如何获取当前正在运行的进程的文件名?

  23. 23

    在Emacs中,如何在Finder中显示当前文件?

  24. 24

    如何在QGridLayout中获取QComboBox的当前文本?

  25. 25

    如何在python中获取Windows短文件名?

  26. 26

    如何在Mocha Reporter中获取测试文件名

  27. 27

    如何在Django中获取上传的文件名

  28. 28

    如何在Bash中获取文件名的通配符部分

  29. 29

    如何在Openerp中获取上载的文件名

热门标签

归档