使用纱线资源管理器的困惑

debugcn 发表于 Dev

网络摇滚

我正在尝试在Amazon AWS中运行一个简单的pyspark作业，并将其配置为通过spark-default.conf文件使用Yarn。我对Yarn部署代码有些困惑。

我看到一些示例代码，如下所示：

conf = SparkConf()
conf.setMaster('yarn-client')
conf.setAppName('spark-yarn')
sc = SparkContext(conf=conf)

而且我不确定在指定'yarn-client'的情况下如何执行spark作业。我通常按如下方式进行：

$spark-submit --deploy-mode client spark-job.py

但是之间有什么区别

$spark-submit --deploy-mode client spark-job.py

和

$spark-submit spark-job.py

如何确定查看Spark日志是作业是在客户端模式下运行还是在集群或纱线客户端上运行？

鬼

默认--deploy-mode值为客户端。因此，下面的spark-submit都将在客户端模式下运行。

$spark-submit --deploy-mode client spark-job.py

和

$spark-submit spark-job.py

如果指定--master yarn，则它将在客户端模式下以yarn运行。

注意：--master群集的主URL（例如，用于独立群集spark：//23.195.26.187：7077）模式类型*独立* YARN * Mesos * Kubernetes

--deploy-mode：将驱动程序部署在工作程序节点（群集）上还是本地部署为外部客户端（客户端）（默认值：客户端）* client * cluster

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

“纱线资源管理器”产生“系统找不到指定的批次标签 - 资源管理器”

来自分类Dev

使用BHO扩展Windows资源管理器

来自分类Dev

使用LoopBack API资源管理器

来自分类Dev

资源管理器在我的应用中使用

来自分类Dev

使用LoopBack API资源管理器

来自分类Dev

JMS连接号在Netstat / MQ资源管理器中使我感到困惑

来自分类Dev

Azure CosmosDB查询资源管理器与数据资源管理器

来自分类Dev

管理Azure资源管理器存储Powershell

来自分类Dev

在SPARK for Linux集群中作为资源管理器使用纱线-Kubernetes内部和Kubernetes外部

来自分类Dev

是否不赞成使用Azure管理库而推荐使用Azure资源管理器？

来自分类Dev

在文件资源管理器中打开目录

来自分类Dev

获取Windows资源管理器的进程句柄

来自分类常见问题

Android Studio中的文件资源管理器

来自分类Dev

Web服务资源管理器错误500

来自分类Dev

如何打开Pydev包资源管理器

来自分类Dev

资源管理器在CreateProcess挂钩上崩溃

来自分类Dev

无法还原Toad对象资源管理器

来自分类Dev

vim nerdtree vs“ E：”资源管理器？

来自分类Dev

mklink访问被拒绝，但资源管理器成功

来自分类Dev

python打开windows资源管理器

来自分类Dev

如何从Qt打开文件资源管理器？

来自分类Dev

Visual Studio测试资源管理器图标

来自分类Dev

wpf动态对象资源管理器

来自分类Dev

如何运行多个Windows资源管理器？

来自分类Dev

Windows资源管理器高级搜索

来自分类Dev

资源管理器不会自动刷新

来自分类Dev

Windows资源管理器ID名称

来自分类Dev

Windows资源管理器-默认窗口尺寸

来自分类Dev

如何打开Pydev包资源管理器

Related 相关文章

文章