Hadoop中的作业和任务调度

得到

当我在本幻灯片中阅读延迟公平调度时,我对Hadoop中的“作业调度”和“任务调度”一词几乎不感到困惑

如果我的以下假设有误,请纠正我:

  1. 当用户计划多个作业时,默认计划程序,容量计划程序和公平计划程序仅在作业级别有效。如果系统中只有一项工作,那么他们就不会扮演任何角色。这些调度算法构成“作业调度”的基础

  2. 每个作业可以具有多个映射并减少任务,它们如何分配给每台计算机?如何为一项工作安排任务?“任务计划”的基础是什么?

SSaikia_JtheRocker

如果使用的是公平调度程序,则当有一个作业正在运行时,该作业将使用整个群集。当提交其他作业时,将腾出的任务插槽分配给新作业,以便每个作业获得大致相同的CPU时间。

默认的Hadoop调度程序形成作业队列不同,它可以让短作业在合理的时间内完成,而不会使长作业饿死。这也是在多个用户之间共享集群的简便方法。公平共享也可以与工作优先级一起使用-优先级用作权重,以确定每个任务获得的总计算时间的比例。

CapacityScheduler被设计为允许共享一个大集群,同时给予每一个组织的最小容量保证。中心思想是,Hadoop Map-Reduce集群中的可用资源在多个组织之间进行划分,这些组织根据计算需求共同为集群提供资金。组织还有一个额外的好处,即组织可以访问其他人未使用的任何多余容量。这以成本有效的方式为组织提供了弹性。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

线程和任务调度

来自分类Dev

任务调度器批处理作业执行

来自分类Dev

在Linux中调度任务

来自分类Dev

Hadoop,Oozie中作业,应用程序,任务,任务尝试日志之间的差异

来自分类Dev

Hadoop作业跟踪程序和任务跟踪程序未在ubuntu 13.10上运行

来自分类Dev

Hadoop作业跟踪程序和任务跟踪程序未在ubuntu 13.10上运行

来自分类Dev

ubuntu 中的任务调度器

来自分类Dev

在 Spring 中调度多个任务

来自分类Dev

使用Bull和Typescript进行作业调度

来自分类Dev

可扩展的作业队列系统,用于大规模任务调度

来自分类Dev

可扩展的作业队列系统,用于大规模任务调度

来自分类Dev

JavaScript 任务调度、宏任务和微任务

来自分类Dev

在调度程序中调度 Laravel 作业,5.5 之前

来自分类Dev

MVC应用程序中的作业调度

来自分类Dev

plsql 引号中的 Oracle 调度作业错误

来自分类Dev

调度命令和任务Laravel

来自分类Dev

Hadoop cgroup和调度程序之间的区别

来自分类Dev

Java中的动态调度并行任务执行

来自分类Dev

气流中的任务调度不起作用

来自分类Dev

阐明Map任务并减少hadoop中的任务?

来自分类Dev

Hadoop挂机和作业完成通知

来自分类Dev

在Dataproc中,如何访问Spark和Hadoop作业历史记录?

来自分类Dev

是否可以在Hadoop Mapreduce中为单个作业打印Mapper和reducer输出

来自分类Dev

删除Crontab中的现有作业/任务

来自分类Dev

在Quartz中,如何通知作业调度程序已关闭?

来自分类Dev

如何通过cron在Firefox中打开url(cron作业调度)

来自分类Dev

将队列中的作业调度到多个线程上

来自分类Dev

等待Hadoop中的几个作业完成

来自分类Dev

在Hadoop流作业中编写Parquet输出

Related 相关文章

热门标签

归档