从pyspark读取hdfs中的文件

用户名

我正在尝试读取我的hdfs中的文件。这是我的hadoop文件结构的展示。

hduser@GVM:/usr/local/spark/bin$ hadoop fs -ls -R /
drwxr-xr-x   - hduser supergroup          0 2016-03-06 17:28 /inputFiles
drwxr-xr-x   - hduser supergroup          0 2016-03-06 17:31 /inputFiles/CountOfMonteCristo
-rw-r--r--   1 hduser supergroup    2685300 2016-03-06 17:31 /inputFiles/CountOfMonteCristo/BookText.txt

这是我的pyspark代码:

from pyspark import SparkContext, SparkConf

conf = SparkConf().setAppName("myFirstApp").setMaster("local")
sc = SparkContext(conf=conf)

textFile = sc.textFile("hdfs://inputFiles/CountOfMonteCristo/BookText.txt")
textFile.first()

我得到的错误是:

Py4JJavaError: An error occurred while calling o64.partitions.
: java.lang.IllegalArgumentException: java.net.UnknownHostException: inputFiles

这是因为我未正确设置sparkContext吗?我正在通过虚拟机在ubuntu 14.04虚拟机中运行它。

我不确定我在做什么错...

Shawn Guo

如果未提供任何配置,则可以通过完整路径访问HDFS文件。(如果hdfs位于本地环境中,则namenodehost是您的本地主机)。

hdfs://namenodehost/inputFiles/CountOfMonteCristo/BookText.txt

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

读取pySpark中的文件范围

来自分类Dev

在pyspark中读取TSV文件

来自分类Dev

在 PySpark 中读取 XML 文件

来自分类Dev

读取HDFS文件分割

来自分类Dev

无法从HDFS读取文件

来自分类Dev

如何在PySpark中读取Avro文件

来自分类Dev

从PySpark中的文件中正确读取类型

来自分类Dev

在pyspark中读取Excel(.xlsx)文件

来自分类Dev

在 pySpark (2.3) 中读取本地 csv 文件

来自分类Dev

如何使用Spark快速从map()中的HDFS中读取文件

来自分类Dev

如何使用Spark快速从map()中的HDFS中读取文件

来自分类Dev

Pyspark:hdfs 中没有这样的文件或目录

来自分类Dev

Spark流无法读取从HDFS中的水槽创建的文件

来自分类Dev

在Spark中从HDFS或S3读取边缘DB文件

来自分类Dev

如何在Spark中读取HDFS序列文件

来自分类Dev

在 Scala/Spark 中从 HDFS 读取文本文件

来自分类Dev

Python HDFS:无法读取文件

来自分类Dev

从HDFS读取文件与本地目录

来自分类Dev

Python HDFS:无法读取文件

来自分类Dev

PySpark HDFS数据流读取/写入

来自分类Dev

Spark仅在HDFS中读取

来自分类Dev

如何在pyspark数据框中读取protoBuffer .pb文件?

来自分类Dev

如何在Pyspark中读取多行CSV文件

来自分类Dev

如何在pyspark中读取和写入coordinateMatrix到文件

来自分类Dev

有没有办法从Mobius中将hdfs中的Parquet文件读取到SqlContext中?

来自分类Dev

无法使用Spark从HDFS读取文件

来自分类Dev

Pydoop卡在HDFS文件的读取线上

来自分类Dev

从HDFS读取文件vs本地目录

来自分类Dev

使用Pyspark将文件从HDFS中的一个目录移动到另一目录