使用纱线资源管理器的困惑

网络摇滚

我正在尝试在Amazon AWS中运行一个简单的pyspark作业,并将其配置为通过spark-default.conf文件使用Yarn。我对Yarn部署代码有些困惑。

我看到一些示例代码,如下所示:

conf = SparkConf()
conf.setMaster('yarn-client')
conf.setAppName('spark-yarn')
sc = SparkContext(conf=conf)

而且我不确定在指定'yarn-client'的情况下如何执行spark作业。我通常按​​如下方式进行:

$spark-submit --deploy-mode client spark-job.py

但是之间有什么区别

$spark-submit --deploy-mode client spark-job.py

$spark-submit spark-job.py

如何确定查看Spark日志是作业是在客户端模式下运行还是在集群或纱线客户端上运行?

默认--deploy-mode值为客户端。因此,下面的spark-submit都将在客户端模式下运行。

$spark-submit --deploy-mode client spark-job.py

$spark-submit spark-job.py

如果指定--master yarn,则它将在客户端模式下以yarn运行。

注意:--master群集的主URL(例如,用于独立群集spark://23.195.26.187:7077)模式类型*独立* YARN * Mesos * Kubernetes

--deploy-mode:将驱动程序部署在工作程序节点(群集)上还是本地部署为外部客户端(客户端)(默认值:客户端)* client * cluster

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

“纱线资源管理器”产生“系统找不到指定的批次标签 - 资源管理器”

来自分类Dev

使用BHO扩展Windows资源管理器

来自分类Dev

使用LoopBack API资源管理器

来自分类Dev

资源管理器在我的应用中使用

来自分类Dev

使用LoopBack API资源管理器

来自分类Dev

JMS连接号在Netstat / MQ资源管理器中使我感到困惑

来自分类Dev

Azure CosmosDB查询资源管理器与数据资源管理器

来自分类Dev

管理Azure资源管理器存储Powershell

来自分类Dev

在SPARK for Linux集群中作为资源管理器使用纱线-Kubernetes内部和Kubernetes外部

来自分类Dev

是否不赞成使用Azure管理库而推荐使用Azure资源管理器?

来自分类Dev

在文件资源管理器中打开目录

来自分类Dev

获取Windows资源管理器的进程句柄

来自分类常见问题

Android Studio中的文件资源管理器

来自分类Dev

Web服务资源管理器错误500

来自分类Dev

如何打开Pydev包资源管理器

来自分类Dev

资源管理器在CreateProcess挂钩上崩溃

来自分类Dev

无法还原Toad对象资源管理器

来自分类Dev

vim nerdtree vs“ E:”资源管理器?

来自分类Dev

mklink访问被拒绝,但资源管理器成功

来自分类Dev

python打开windows资源管理器

来自分类Dev

如何从Qt打开文件资源管理器?

来自分类Dev

Visual Studio测试资源管理器图标

来自分类Dev

wpf动态对象资源管理器

来自分类Dev

如何运行多个Windows资源管理器?

来自分类Dev

Windows资源管理器高级搜索

来自分类Dev

资源管理器不会自动刷新

来自分类Dev

Windows资源管理器ID名称

来自分类Dev

Windows资源管理器-默认窗口尺寸

来自分类Dev

如何打开Pydev包资源管理器

Related 相关文章

热门标签

归档