hadoop在输入文件夹中选择输入文件

赵政石

training_set文件夹中,文件像这样存在

mv_000000
mv_000001
mv_000002
...

索引是可以在以下位置找到的电影ID movie_title.txt

movie_title.tx 文件就像:

1,2003,Dinosaur Planet
2,2004,Isle of Man TT 2004 Review
3,1997,Character   
4,1994,Paula Abdul's Get Up & Dance
5,2004,The Rise and Fall of ECW 
...

第一栏是特定电影名称的索引。

我根据netplix竞赛奖金数据集练习hadoop。我假设我插入了特定的电影标题,例如“ Sick”。然后转到movie_titles.txt文件并搜索“ sick”的电影标题ID。最后设置输入路径电影标题ID。

例如,如果我以以下方式启动hadoop程序:

hadoop jar ~ [input path] [output path] [moiveA name]

比必须设置的输入路径training_set/mv_movieAIndex

正如我所说的,电影ID的信息存在于上movie_title.txt

请给我一些提示,以解决此问题。

铁匠

您的要求似乎根本不相关Hadoop您所需id要做的就是对照hadoop jar命令的第3个参数指定的movieName查找以下代码段将完成工作:

private static Map<String, Integer> getMovieMappings(String filePath)
        throws IOException {
    Map<String, Integer> movieMap = new HashMap<String, Integer>();
    BufferedReader br = null;
    try {
        br = new BufferedReader(new FileReader(filePath));
        String line;
        while ((line = br.readLine()) != null) {
            String[] temp = line.split(",");
            movieMap.put(temp[2].trim(), Integer.parseInt(temp[0].trim()));
        }
    } finally {
        if (br != null)   br.close(); 
    }
    return movieMap;
}

现在在驱动程序中,只需获取地图并相应地设置inputPath即可:

Map<String, Integer> movieMap = getMovieMappings("/pathTo/movie_title.txt");
int movieId = movieMap.get(args[2]);
System.out.println(String.format("mv_%06d", movieId));
FileInputFormat.addInputPath( job, 
                              new Path( "training_set",
                                        String.format("mv_%06d", movieId)));

可能会有所帮助。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在HTML输入中选择文件夹位置

来自分类Dev

检查输入是文件还是文件夹

来自分类Dev

Xcode构建阶段输入文件夹

来自分类Dev

从php中的文件夹中选择文件名

来自分类Dev

从文件夹JQuery中选择随机图像文件

来自分类Dev

如何快速从文件夹树中选择随机文件?

来自分类Dev

在VSCode中选择文件夹时打开默认文件

来自分类Dev

在QFileDialog中选择文件或文件夹pyqt5

来自分类Dev

从文件夹JQuery中选择随机图像文件

来自分类Dev

从不同的文件夹中选择文件

来自分类Dev

如何从文件夹中选择最佳的.class文件?

来自分类Dev

从文件夹中选择所有文件 - Python

来自分类Dev

找不到构建输入文件-整个文件夹?

来自分类Dev

如何从servlet的项目文件夹中提供输入文件

来自分类Dev

Java-从Project文件夹获取文件作为输入

来自分类Dev

使用.txt输入文件创建文件夹和子文件夹

来自分类Dev

在Outlook文件夹视图(VSTO)中选择文件夹自动滚动到所选内容

来自分类Dev

如何在grails中选择文件夹并获取文件夹路径?

来自分类Dev

从Android中的资产文件夹中选择图片

来自分类Dev

Outlook VBA在子文件夹中选择消息

来自分类Dev

获取用户在闪亮中选择的文件夹的路径

来自分类Dev

在Dropbox文件夹中使用encfs文件夹进行“输入/输出错误”

来自分类Dev

复制文件夹后无法输入文件夹/ usr / share / icons / XX错误

来自分类Dev

用户在InputBox中输入文件夹名称,然后在指定目录中搜索文件夹

来自分类Dev

用户输入 - 文件夹和子文件夹创建

来自分类Dev

如何使用输入打开某个文件夹中的文件夹 [C++]

来自分类Dev

自动完成文本框的文件夹输入

来自分类Dev

通过批量输入和C ++代码打开文件夹

来自分类Dev

批处理脚本,以提示输入目标文件夹列表

Related 相关文章

  1. 1

    在HTML输入中选择文件夹位置

  2. 2

    检查输入是文件还是文件夹

  3. 3

    Xcode构建阶段输入文件夹

  4. 4

    从php中的文件夹中选择文件名

  5. 5

    从文件夹JQuery中选择随机图像文件

  6. 6

    如何快速从文件夹树中选择随机文件?

  7. 7

    在VSCode中选择文件夹时打开默认文件

  8. 8

    在QFileDialog中选择文件或文件夹pyqt5

  9. 9

    从文件夹JQuery中选择随机图像文件

  10. 10

    从不同的文件夹中选择文件

  11. 11

    如何从文件夹中选择最佳的.class文件?

  12. 12

    从文件夹中选择所有文件 - Python

  13. 13

    找不到构建输入文件-整个文件夹?

  14. 14

    如何从servlet的项目文件夹中提供输入文件

  15. 15

    Java-从Project文件夹获取文件作为输入

  16. 16

    使用.txt输入文件创建文件夹和子文件夹

  17. 17

    在Outlook文件夹视图(VSTO)中选择文件夹自动滚动到所选内容

  18. 18

    如何在grails中选择文件夹并获取文件夹路径?

  19. 19

    从Android中的资产文件夹中选择图片

  20. 20

    Outlook VBA在子文件夹中选择消息

  21. 21

    获取用户在闪亮中选择的文件夹的路径

  22. 22

    在Dropbox文件夹中使用encfs文件夹进行“输入/输出错误”

  23. 23

    复制文件夹后无法输入文件夹/ usr / share / icons / XX错误

  24. 24

    用户在InputBox中输入文件夹名称,然后在指定目录中搜索文件夹

  25. 25

    用户输入 - 文件夹和子文件夹创建

  26. 26

    如何使用输入打开某个文件夹中的文件夹 [C++]

  27. 27

    自动完成文本框的文件夹输入

  28. 28

    通过批量输入和C ++代码打开文件夹

  29. 29

    批处理脚本,以提示输入目标文件夹列表

热门标签

归档