Hadoop中的作业和任务调度

GoT 发表于 Dev

得到

当我在本幻灯片中阅读延迟公平调度时，我对Hadoop中的“作业调度”和“任务调度”一词几乎不感到困惑。

如果我的以下假设有误，请纠正我：

当用户计划多个作业时，默认计划程序，容量计划程序和公平计划程序仅在作业级别有效。如果系统中只有一项工作，那么他们就不会扮演任何角色。这些调度算法构成“作业调度”的基础
每个作业可以具有多个映射并减少任务，它们如何分配给每台计算机？如何为一项工作安排任务？“任务计划”的基础是什么？

SSaikia_JtheRocker

如果使用的是公平调度程序，则当有一个作业正在运行时，该作业将使用整个群集。当提交其他作业时，将腾出的任务插槽分配给新作业，以便每个作业获得大致相同的CPU时间。

与默认的Hadoop调度程序形成作业队列不同，它可以让短作业在合理的时间内完成，而不会使长作业饿死。这也是在多个用户之间共享集群的简便方法。公平共享也可以与工作优先级一起使用-优先级用作权重，以确定每个任务获得的总计算时间的比例。

该CapacityScheduler被设计为允许共享一个大集群，同时给予每一个组织的最小容量保证。中心思想是，Hadoop Map-Reduce集群中的可用资源在多个组织之间进行划分，这些组织根据计算需求共同为集群提供资金。组织还有一个额外的好处，即组织可以访问其他人未使用的任何多余容量。这以成本有效的方式为组织提供了弹性。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-3

我来说两句

0条评论

登录后参与评论

上一篇：Symfony2文件找到的类不在其中

来自分类Dev

Related 相关文章

文章

Hadoop中的作业和任务调度

Hadoop中的作业和任务调度

线程和任务调度

任务调度器批处理作业执行

在Linux中调度任务

Hadoop，Oozie中作业，应用程序，任务，任务尝试日志之间的差异

Hadoop作业跟踪程序和任务跟踪程序未在ubuntu 13.10上运行

Hadoop作业跟踪程序和任务跟踪程序未在ubuntu 13.10上运行

ubuntu 中的任务调度器

在 Spring 中调度多个任务

使用Bull和Typescript进行作业调度

可扩展的作业队列系统，用于大规模任务调度

可扩展的作业队列系统，用于大规模任务调度

JavaScript 任务调度、宏任务和微任务

在调度程序中调度 Laravel 作业，5.5 之前

MVC应用程序中的作业调度

plsql 引号中的 Oracle 调度作业错误

调度命令和任务Laravel

Hadoop cgroup和调度程序之间的区别

Java中的动态调度并行任务执行

气流中的任务调度不起作用

阐明Map任务并减少hadoop中的任务？

Hadoop挂机和作业完成通知

在Dataproc中，如何访问Spark和Hadoop作业历史记录？

是否可以在Hadoop Mapreduce中为单个作业打印Mapper和reducer输出

删除Crontab中的现有作业/任务

在Quartz中，如何通知作业调度程序已关闭？

如何通过cron在Firefox中打开url（cron作业调度）

将队列中的作业调度到多个线程上

等待Hadoop中的几个作业完成

在Hadoop流作业中编写Parquet输出