Amazon Elastic Map Reduce:作业流程失败,因为尚未生成输出文件

n4cer500

我有一个执行三个任务的Amazon EMR作业流程,第一个任务的输出是随后两个任务的输入。第二个任务的输出由第三个任务DistributedCache使用。

我已经在EMR网站(控制台)上完全创建了工作流程,但是集群立即失败了,因为它找不到分布式缓存文件-因为尚未在步骤#1中创建它。

我唯一的选择是通过boostrap操作从CLI创建这些步骤并指定--wait-for-steps选项吗?我无法执行一个任务的输入依赖于另一任务的输出的多步骤作业流程,这似乎很奇怪。

n4cer500

最后,我通过创建一个自举但没有步骤的Amazon EMR集群解决了这个问题。然后我通过SSH进入头部并在控制台上运行hadoop作业。

现在,我可以灵活地将它们添加到每个作业具有单独配置选项的脚本中。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Amazon Elastic Map Reduce:命令行工具安装问题?

来自分类Dev

Amazon Elastic Map Reduce:在命令行工具中列出作业流问题?

来自分类Dev

Elastic Map Reduce和Amazon S3:关于访问键的错误

来自分类Dev

Elastic Map Reduce和Amazon S3:关于访问键的错误

来自分类Dev

Map Reduce作业生成空的输出文件

来自分类Dev

Amazon Elastic Transcoder与FFMPEG

来自分类Dev

Amazon Elastic Transcoder与FFMPEG

来自分类Dev

在Amazon Elastic Transcoder上自动化转码作业

来自分类Dev

Amazon Elastic Mapreduce默认配置

来自分类Dev

Amazon Elastic Mapreduce默认配置

来自分类Dev

连接到上游时connect()失败(111:连接被拒绝)。Java(SparkJava)Amazon Elastic

来自分类Dev

静态文件不起作用Django Elastic Beanstalk Amazon Linux 2

来自分类Dev

如何配置Amazon AWS Elastic Beanstalk服务?

来自分类Dev

在Amazon Elastic Beanstalk上安装Anaconda

来自分类Dev

使用Amazon Elastic IP的Cassandra Datastax Enterprise

来自分类Dev

Elastic Beanstalk上的PostgreSQL(Amazon Linux 2)

来自分类Dev

Amazon Elastic Mapreduce:引导操作问题?

来自分类Dev

在Amazon Elastic Beanstalk上运行Python的问题

来自分类Dev

Amazon Elastic Transcoder Http请求错误

来自分类Dev

跨Amazon Elastic Beanstalk节点共享数据

来自分类Dev

将git标签部署到Amazon Elastic Beanstalk

来自分类Dev

使用RabbitMQ的Amazon Elastic Beanstalk上的Celery超时异常

来自分类Dev

Amazon EC2,Elastic Beanstalk:我的图像消失了

来自分类Dev

设置没有公共IP的Amazon Elastic Beanstalk应用

来自分类Dev

在Amazon Elastic Beanstalk上使用Docker部署Django

来自分类Dev

Amazon Elastic Beanstalk内部和互联网访问

来自分类Dev

如何在Amazon Elastic Beanstalk上安装PHP IMAP扩展

来自分类Dev

Amazon Elastic MapReduce上的Spark Java错误NoClassDefFoundError

来自分类Dev

Amazon Web Service无法删除Elastic Beanstalk环境

Related 相关文章

  1. 1

    Amazon Elastic Map Reduce:命令行工具安装问题?

  2. 2

    Amazon Elastic Map Reduce:在命令行工具中列出作业流问题?

  3. 3

    Elastic Map Reduce和Amazon S3:关于访问键的错误

  4. 4

    Elastic Map Reduce和Amazon S3:关于访问键的错误

  5. 5

    Map Reduce作业生成空的输出文件

  6. 6

    Amazon Elastic Transcoder与FFMPEG

  7. 7

    Amazon Elastic Transcoder与FFMPEG

  8. 8

    在Amazon Elastic Transcoder上自动化转码作业

  9. 9

    Amazon Elastic Mapreduce默认配置

  10. 10

    Amazon Elastic Mapreduce默认配置

  11. 11

    连接到上游时connect()失败(111:连接被拒绝)。Java(SparkJava)Amazon Elastic

  12. 12

    静态文件不起作用Django Elastic Beanstalk Amazon Linux 2

  13. 13

    如何配置Amazon AWS Elastic Beanstalk服务?

  14. 14

    在Amazon Elastic Beanstalk上安装Anaconda

  15. 15

    使用Amazon Elastic IP的Cassandra Datastax Enterprise

  16. 16

    Elastic Beanstalk上的PostgreSQL(Amazon Linux 2)

  17. 17

    Amazon Elastic Mapreduce:引导操作问题?

  18. 18

    在Amazon Elastic Beanstalk上运行Python的问题

  19. 19

    Amazon Elastic Transcoder Http请求错误

  20. 20

    跨Amazon Elastic Beanstalk节点共享数据

  21. 21

    将git标签部署到Amazon Elastic Beanstalk

  22. 22

    使用RabbitMQ的Amazon Elastic Beanstalk上的Celery超时异常

  23. 23

    Amazon EC2,Elastic Beanstalk:我的图像消失了

  24. 24

    设置没有公共IP的Amazon Elastic Beanstalk应用

  25. 25

    在Amazon Elastic Beanstalk上使用Docker部署Django

  26. 26

    Amazon Elastic Beanstalk内部和互联网访问

  27. 27

    如何在Amazon Elastic Beanstalk上安装PHP IMAP扩展

  28. 28

    Amazon Elastic MapReduce上的Spark Java错误NoClassDefFoundError

  29. 29

    Amazon Web Service无法删除Elastic Beanstalk环境

热门标签

归档