spark无法从s3读取

欢乐深渊巴塔查吉

我正在使用以下命令创建我的 spark-shell。

spark-shell --packages org.apache.hadoop:hadoop-aws:3.1.1,com.amazonaws:aws-java-sdk-pom:1.11.392,org.wso2.orbit.joda-time:joda-time:2.9.4.wso2v1

然后我运行下面的代码来访问 S3 中的文件。

val accessKeyId = "myid"
val secretAccessKey = "mykey"
sc.hadoopConfiguration.set("fs.s3a.awsAccessKeyId", accessKeyId)
sc.hadoopConfiguration.set("fs.s3a.awsSecretAccessKey",secretAccessKey)
sc.hadoopConfiguration.set("fs.s3a.impl","org.apache.hadoop.fs.s3a.S3AFileSystem")
val lines = sc.textFile("s3a://bucket-name/path-to-file")

现在运行下面的代码给了我下面的错误。

scala> lines.count()
java.lang.NoClassDefFoundError: org/apache/hadoop/fs/StreamCapabilities
  at java.lang.ClassLoader.defineClass1(Native Method)
  at java.lang.ClassLoader.defineClass(ClassLoader.java:763)
  at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
  at java.net.URLClassLoader.defineClass(URLClassLoader.java:467)
  at java.net.URLClassLoader.access$100(URLClassLoader.java:73)
  at java.net.URLClassLoader$1.run(URLClassLoader.java:368)
基肖尔

无法找到 的依赖项org.apache.hadoop.fs.StreamCapabilities

hadoop-common-3.1.jar

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Spark中从HDFS或S3读取边缘DB文件

来自分类Dev

无法使用R从S3读取csv

来自分类Dev

使用sc.textFile(“ s3n:// ...)从S3 Spark读取文件

来自分类Dev

无法从仅使用s3a的s3协议的S3存储桶中读取

来自分类Dev

使用 Spark 是否可以在不接触磁盘的情况下从 s3 读取和从 s3 写入?

来自分类Dev

Spark无法读取法兰克福地区AWS S3上存储的文件(爱尔兰地区工作正常)

来自分类Dev

Spark无法读取法兰克福地区AWS S3上存储的文件(爱尔兰地区工作正常)

来自分类Dev

通过Spark在本地读取S3文件(或者更好:pyspark)

来自分类Dev

使用Spark读取S3文件时获取NullPointerException

来自分类Dev

从子目录递归读取文件,并使用s3或本地文件系统中的spark

来自分类Dev

这是从S3中读取Json文件的最快方法:Spark

来自分类Dev

按日期周期从Spark中的S3读取多个文件

来自分类Dev

从Spark / scala中的s3读取时,分区ID被隐式转换

来自分类Dev

如何判断Spark使用什么AWS凭证读取S3文件?

来自分类Dev

从S3读取数据时,Spark是否保证一致性?

来自分类Dev

在创建Spark RDD之前将数据从S3读取到内存

来自分类Dev

这是从S3中读取Json文件的最快方法:Spark

来自分类Dev

为什么Spark从S3读取和写入如此之快

来自分类Dev

Spark从S3读取大文件时,能否将数据分发到不同的节点

来自分类Dev

无法从 Spark 连接到 S3 - AmazonS3Exception 状态代码:400

来自分类Dev

send_file错误:ActionController :: MissingFile-无法读取文件-从S3

来自分类Dev

为什么我无法从Delphi VCL应用程序读取和写入Amazon S3?

来自分类Dev

如何从s3读取文件?

来自分类Dev

使用Lambda从S3读取数据

来自分类Dev

从Amazon S3读取Servlet太慢

来自分类Dev

S3:以相反的顺序读取对象?

来自分类Dev

从S3读取权限问题雪花

来自分类Dev

从S3读取.pptx文件

来自分类Dev

如何从s3读取文件?

Related 相关文章

  1. 1

    在Spark中从HDFS或S3读取边缘DB文件

  2. 2

    无法使用R从S3读取csv

  3. 3

    使用sc.textFile(“ s3n:// ...)从S3 Spark读取文件

  4. 4

    无法从仅使用s3a的s3协议的S3存储桶中读取

  5. 5

    使用 Spark 是否可以在不接触磁盘的情况下从 s3 读取和从 s3 写入?

  6. 6

    Spark无法读取法兰克福地区AWS S3上存储的文件(爱尔兰地区工作正常)

  7. 7

    Spark无法读取法兰克福地区AWS S3上存储的文件(爱尔兰地区工作正常)

  8. 8

    通过Spark在本地读取S3文件(或者更好:pyspark)

  9. 9

    使用Spark读取S3文件时获取NullPointerException

  10. 10

    从子目录递归读取文件,并使用s3或本地文件系统中的spark

  11. 11

    这是从S3中读取Json文件的最快方法:Spark

  12. 12

    按日期周期从Spark中的S3读取多个文件

  13. 13

    从Spark / scala中的s3读取时,分区ID被隐式转换

  14. 14

    如何判断Spark使用什么AWS凭证读取S3文件?

  15. 15

    从S3读取数据时,Spark是否保证一致性?

  16. 16

    在创建Spark RDD之前将数据从S3读取到内存

  17. 17

    这是从S3中读取Json文件的最快方法:Spark

  18. 18

    为什么Spark从S3读取和写入如此之快

  19. 19

    Spark从S3读取大文件时,能否将数据分发到不同的节点

  20. 20

    无法从 Spark 连接到 S3 - AmazonS3Exception 状态代码:400

  21. 21

    send_file错误:ActionController :: MissingFile-无法读取文件-从S3

  22. 22

    为什么我无法从Delphi VCL应用程序读取和写入Amazon S3?

  23. 23

    如何从s3读取文件?

  24. 24

    使用Lambda从S3读取数据

  25. 25

    从Amazon S3读取Servlet太慢

  26. 26

    S3:以相反的顺序读取对象?

  27. 27

    从S3读取权限问题雪花

  28. 28

    从S3读取.pptx文件

  29. 29

    如何从s3读取文件?

热门标签

归档