在sbt中,我们如何指定Spark依赖的hadoop版本?

迈克尔兹

好吧,我有一个使用spark和spark sql的sbt项目,但是我的集群使用hadoop 1.0.4和spark 1.2和spark-sql 1.2,目前我的build.sbt看起来像这样:

libraryDependencies ++= Seq(
    "com.datastax.cassandra" % "cassandra-driver-core" % "2.1.5",
    "com.datastax.cassandra" % "cassandra-driver-mapping" % "2.1.5",
    "com.datastax.spark" % "spark-cassandra-connector_2.10" % "1.2.1",
    "org.apache.spark" % "spark-core_2.10" % "1.2.1",
    "org.apache.spark" % "spark-sql_2.10" % "1.2.1",
)

事实证明,我正在使用hadoop 2.2.0运行该应用程序,但我希望在我的依赖项中看到hadoop-*-1.0.4。我该怎么办?

斯文德

您可以从Spark到hadoop排除依赖项,并添加具有所需版本的显式依赖项,如下所示:

libraryDependencies ++= Seq(
    "com.datastax.cassandra" % "cassandra-driver-core" % "2.1.5",
    "com.datastax.cassandra" % "cassandra-driver-mapping" % "2.1.5",
    "com.datastax.spark" % "spark-cassandra-connector" %% "1.2.1",
    "org.apache.spark" % "spark-sql_2.10" % "1.2.1" excludeAll(
         ExclusionRule("org.apache.hadoop")
    ),
    "org.apache.hadoop" % "hadoop-client" % "2.2.0"
)

您可能不需要依赖项,spark-core因为spark-sql应该将其传递给您。

另外,请注意,这spark-cassandra-connector也可能取决于火花,这可能会再次传递可依赖的hadoop =>,您可能还需要在其中添加排除规则。

最后说明:一个很好的工具,用于调查哪个依赖项来自哪里https://github.com/jrudolph/sbt-dependency-graph

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何找出我们在Gradle中包含的任何依赖项的最新版本?

来自分类Dev

在Helm应用程序图表中创建时,我们如何指定依赖项配置值?

来自分类Dev

我们如何检查Oracle版本

来自分类Dev

我们如何在TFS 2013版本管理中删除版本?

来自分类Dev

iTunes Connect中的应用程序版本与我们在Xcode中指定的版本之间的关系

来自分类Dev

在我们的库中,如何告诉webpack跳过依赖关系?

来自分类Dev

如何在 Dagger2 中实例化我们的依赖图实例

来自分类Dev

如何指定sbt依赖关系以及预期的JDK版本

来自分类Dev

我们如何为依赖类型定义`eqType`?

来自分类Dev

我们如何为插件运行 Gradle 依赖报告?

来自分类Dev

我们如何在svn和ClearCase中检出先前版本的特定代码库(或数据)

来自分类Dev

我们如何将用户重定向到 Django 中的指定管理员?

来自分类Dev

如何在Scala Spark中持久保存我们从dataFrame动态创建的列表

来自分类Dev

SimpleNLG:我们如何指定数量?

来自分类Dev

我们如何指定执行战术的时间

来自分类Dev

如何指定我们的应用需要IOS 6?

来自分类Dev

我们如何指定ssh默认身份?

来自分类Dev

我们如何指定类实例的顺序?

来自分类Dev

我们如何在Spark结构化流中管理偏移量?(_spark_metadata问题)

来自分类Dev

我们如何在迁移学习中为我们的培训设置标签?

来自分类Dev

为什么我们在 Docker Compose 中增加版本?(版本 1、2 和 3)

来自分类Dev

我们如何替换R中向量中的元素?

来自分类Dev

我们如何在 Spark-Core 中通过两个不同的字段实现排序?

来自分类Dev

我们如何规定iOS 8中的应用方向?

来自分类Dev

如何确定我们是否在主线程中运行?

来自分类Dev

在Dojo中,我们如何设置选定的下拉选项?

来自分类Dev

我们如何遍历JSTL中的HashMap?

来自分类Dev

我们如何知道Git中哪个分支是新的?

来自分类Dev

我们如何在GDB中完成函数调用?

Related 相关文章

  1. 1

    如何找出我们在Gradle中包含的任何依赖项的最新版本?

  2. 2

    在Helm应用程序图表中创建时,我们如何指定依赖项配置值?

  3. 3

    我们如何检查Oracle版本

  4. 4

    我们如何在TFS 2013版本管理中删除版本?

  5. 5

    iTunes Connect中的应用程序版本与我们在Xcode中指定的版本之间的关系

  6. 6

    在我们的库中,如何告诉webpack跳过依赖关系?

  7. 7

    如何在 Dagger2 中实例化我们的依赖图实例

  8. 8

    如何指定sbt依赖关系以及预期的JDK版本

  9. 9

    我们如何为依赖类型定义`eqType`?

  10. 10

    我们如何为插件运行 Gradle 依赖报告?

  11. 11

    我们如何在svn和ClearCase中检出先前版本的特定代码库(或数据)

  12. 12

    我们如何将用户重定向到 Django 中的指定管理员?

  13. 13

    如何在Scala Spark中持久保存我们从dataFrame动态创建的列表

  14. 14

    SimpleNLG:我们如何指定数量?

  15. 15

    我们如何指定执行战术的时间

  16. 16

    如何指定我们的应用需要IOS 6?

  17. 17

    我们如何指定ssh默认身份?

  18. 18

    我们如何指定类实例的顺序?

  19. 19

    我们如何在Spark结构化流中管理偏移量?(_spark_metadata问题)

  20. 20

    我们如何在迁移学习中为我们的培训设置标签?

  21. 21

    为什么我们在 Docker Compose 中增加版本?(版本 1、2 和 3)

  22. 22

    我们如何替换R中向量中的元素?

  23. 23

    我们如何在 Spark-Core 中通过两个不同的字段实现排序?

  24. 24

    我们如何规定iOS 8中的应用方向?

  25. 25

    如何确定我们是否在主线程中运行?

  26. 26

    在Dojo中,我们如何设置选定的下拉选项?

  27. 27

    我们如何遍历JSTL中的HashMap?

  28. 28

    我们如何知道Git中哪个分支是新的?

  29. 29

    我们如何在GDB中完成函数调用?

热门标签

归档