在调用动作之前,Spark实际上会做什么?

拉里

火花转换必须通过调用操作来触发。如果不执行任何操作,Spark会做什么?在触发执行之前,处理惰性操作(例如,转换)涉及哪些部分或过程?

雅克·拉斯考斯基

tl; dr Spark几乎不执行任何操作(考虑到它通常执行的操作)。

应用转换会创建RDD沿袭,即RDD的DAG。这就是RDD可以满足R的要求的方式-具有弹性并且在丢失地图输出的情况下能够恢复。执行器上不会执行任何操作,序列化,通过有线发送或类似的与网络相关的活动也不会发生。它所做的就是从现有的RDD中创建新的RDD,以构建RDD图。

每个转换调用都会返回一个新的RDD。您从SparkContext开始,并构建应用转换的“管道”。

这是只有当一个动作被调用时DAGScheduler转变成RDDS TaskSets / TaskSetManagers这反过来会作为遗嘱执行人并行任务执行阶段提交作业。

ps但是,有两次转换会触发像sortBy的工作zipWithIndex参见https://issues.apache.org/jira/browse/SPARK-1021

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

CPU在存储指令期间实际上会做什么?

来自分类Dev

C#在属性类上使用[System.Diagnostics.Conditional]属性实际上会做什么

来自分类Dev

当我们声明静态变量时,编译器实际上会做什么?

来自分类Dev

C#在属性类上使用[System.Diagnostics.Conditional]属性实际上会做什么

来自分类Dev

在查询之前调用session_write_close会做什么?

来自分类Dev

在JPA中,实际上将列的nullable设置为false会做什么?

来自分类Dev

Spark DataFrame方法“ toPandas”实际上在做什么?

来自分类Dev

为什么实际上会跳过compileJava?

来自分类Dev

Mongodb的Compact实际上做什么?

来自分类Dev

Kubernetes实际上是做什么的?

来自分类Dev

(void)var实际上做什么?

来自分类Dev

->>实际上是做什么的?

来自分类Dev

调用类后,括号会做什么?

来自分类Dev

为什么 .sort() 实际上会改变变量?

来自分类Dev

调用Tk()实际做什么?

来自分类Dev

调用Tk()实际做什么?

来自分类Dev

gitpod是什么:它实际上是做什么的?

来自分类Dev

NASware会做什么?

来自分类Dev

HashMap(it) 会做什么?

来自分类Dev

python setup.py check实际上做什么?

来自分类Dev

debug和packageName字段实际上是做什么的?

来自分类Dev

@Basic批注实际上是做什么的?

来自分类Dev

Apache Mesos实际上是做什么的?

来自分类Dev

cURL上的-u标志实际上是做什么的?

来自分类Dev

SAFESEH:NO选项实际上是做什么的

来自分类Dev

session_register_shutdown实际上是做什么的?

来自分类Dev

NSString的isLike:实际上是做什么的?

来自分类Dev

to_i参数库实际上是做什么的?

来自分类Dev

“ omega”在这里实际上做什么?

Related 相关文章

热门标签

归档