嘿,这更多是一个Java问题,但它与Hadoop有关。
我在Map Reduce Java Job中的代码上有这一行:
JobConf conf= new JobConf(WordCount.class);
conf.setJobName("Word Count");
.............
.............
.............
FileInputFormat.addInputPath(conf, new Path(args[0]));
而不是“提供”包含许多文件的目录,我该如何设置特定的文件名?
从《 Hadoop:权威指南》这本书中:
输入路径是通过在FileInputFormat上调用静态addInputPath()方法指定的,它可以是单个文件,目录(在这种情况下,输入形成该目录中的所有文件)或文件模式。顾名思义,可以多次调用addInputPath()来使用来自多个路径的输入。
因此,要回答您的问题,您应该仅可以将路径传递到特定的单个文件,并且它将用作唯一输入(只要您不对其他一些路径进行更多的addInputPath()调用)。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句