What is a stage in Apache Spark?

Maher Marwani

so I understand that a stage is a set of tasks that work in the same node.

so why do I get two stages when I work in local?

gorros

A stage is a set of parallel tasks - one task per partition. Number of stages is defined by number of shuffle/wide transformations. enter image description here

So coming back to your case, if you have shuffle operation then it will result in two stages.

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事