列出Scala Emr HDFS档案(CSV档案遗失)

欧巴达·梅斯玛尼

我正在尝试通过以下方法列出emr hdfs上目录中的所有文件:

val directory = new File(directoryPath)
val fileStatusListIterator: RemoteIterator[LocatedFileStatus] = FileUtils.fs.listFiles(new Path(directoryPath), true)
while (fileStatusListIterator.hasNext) {
  val fileStatus = fileStatusListIterator.next
  if (fileStatus.isFile) {
    log.info(s"Iterator File Path: ${fileStatus.getPath}")
  }
}

我的问题:它列出了除csv文件之外的所有内容。

欧巴达·梅斯玛尼

我找到了原因。因为我恰好在清单之前下载了此csv文件。这意味着文件无法按时从迭代器中捕获。因此,我必须使用:

Future.Await(Downloading,Duration.Inf)

因此,它将被迫等待下载完成,然后继续进行。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Haskell中列出TAR档案

来自分类Dev

列出rpm档案中的文件

来自分类Dev

使用zip-conduit列出zip档案

来自分类Dev

如何在Amazon Glacier中列出档案?

来自分类Dev

只列出档案中的文件而不是目录

来自分类Dev

开启CSV档案

来自分类Dev

修改CSV档案?

来自分类Dev

在C#.NET中列出Amazon Glacier Vault中的档案

来自分类Dev

处理一栏文字档案中的资料遗失

来自分类Dev

将清单写入CSV档案

来自分类Dev

在CSV档案上写入时,档案名称会被分割

来自分类Dev

如何使用AWS EMR使用csv?

来自分类Dev

使用PHP列出.7z,.rar和.tar档案中的文件

来自分类Dev

AWS EMR无主机:hdfs:/// var / log / spark / apps

来自分类Dev

随机存取CSV档案内容

来自分类Dev

写入CSV档案时出现NullPointerException

来自分类Dev

写入CSV档案时发生输入错误

来自分类Dev

整个档案

来自分类Dev

分割CSV档案中的资料,然后使用R写入分片中的档案

来自分类Dev

使用Scala列出给定HDFS路径的所有子目录,直到一定深度。

来自分类Dev

当 Scala Spark 应用程序抛出异常时,为什么 AWS EMR 步骤不会失败

来自分类Dev

CSV档案中的多个逗号,加上分隔符=','?

来自分类Dev

Android应用程式当机-清单检视-CSV档案

来自分类Dev

CSV档案中的多个逗号,加上分隔符=','?

来自分类Dev

如何从亚马逊EMR HDFS Remotley(或任何其他hadoop距离服务器)读取

来自分类Dev

RSS档案不是XML

来自分类Dev

如何命名战争档案?

来自分类Dev

完整档案

来自分类Dev

开启pdf档案