如何在Google Storage的dataproc上执行hadoop fs -getmerge

阿吉克尔

如何将dataproc上的getmerge用于转储到google存储桶中的零件文件。如果我尝试这个,hadoop fs -getmerge gs://my-bucket/temp/part-* gs://my-bucket/temp_merged我会得到一个错误getmerge: /temp_merged (Permission denied)

它可以正常工作,hadoop fs -getmerge gs://my-bucket/temp/part-* temp_merged但是当然可以将合并的文件写在群集计算机上,而不是GS中。

Dennis Huo

根据fsshell文档,该getmerge命令从根本上将目标路径视为“本地”路径(因此,gs://my-bucket/temp_merged它忽略了“方案”和“权限”组件,试图直接写入本地文件系统路径/temp_meged;这并不特定于GCS连接器,你会看到同样的事情,如果你尝试hadoop fs -getmerge gs://my-bucket/temp/part-* hdfs:///temp_merged,甚至更糟的是,如果你尝试类似hadoop fs -getmerge gs://my-bucket/temp/part-* hdfs:///tmp/temp_merged,你可能会觉得它成功的时候,其实文件并没有出现里面hdfs:///tmp/temp_merged,但你的本地文件系统下反而出现了file:///tmp/temp_merged

您可以改为使用管道标准输出/标准输入来实现它;不幸的-getmerge是,/dev/stdout由于.crc文件的权限和使用情况,它不能很好地发挥作用,但是您可以使用hadoop fs -put支持从stdin读取的功能来达到相同的效果

hadoop fs -cat  gs://my-bucket/temp/part-* | \
    hadoop fs -put - gs://my-bucket/temp_merged

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Google Storage的dataproc上执行hadoop fs -getmerge

来自分类Dev

Hadoop -getmerge如何工作?

来自分类Dev

由于磁盘空间不足,Hadoop fs getmerge到远程服务器/计算机

来自分类Dev

hadoop getmerge到另一台机器

来自分类Dev

如何在加密的fs上重设密码?

来自分类Dev

fs-uae:如何在Linux上加载qemu插件?

来自分类Dev

如何在不全局修改fs的情况下(编写库时)执行Promise.promisfyAll(fs)?

来自分类Dev

无法从Java执行hadoop fs -put命令

来自分类Dev

Kubernaties无法在Google Container Engine上挂载NFS FS

来自分类Dev

在hadoop fs -ls上的连接被拒绝

来自分类Dev

如何在Node.js中的fs.createWriteStream上拦截回调

来自分类Dev

如何在f2fs上加密文件或文件夹?

来自分类Dev

如何在 FAT 中运行 Linux 脚本(它不像在 Linux FS 上那样工作)

来自分类Dev

如何选择具有反应和电子的fs上的文件?

来自分类Dev

如何搜索FS集合?

来自分类Dev

如何将AIX上的文件从一个FS复制到另一个FS?

来自分类Dev

如何在Google Dataproc上安排Spark作业?

来自分类Dev

hdfs dfs -getmerge命令有什么作用?

来自分类Dev

如何使用NodeJ中的FS?“我是FS模块”

来自分类Dev

“ mke2fs -r fs修订级别”-如何使用?

来自分类Dev

如何使用hadoop fs -cp s3:// <bucket> hdfs:/// tmp

来自分类Dev

Google Compute Engine VM实例:VFS:无法在未知块上挂载根fs

来自分类Dev

当带有 async fs.readdir 的递归函数完成执行时如何得到通知?

来自分类Dev

如何在FS_IOC_FIEMAP中使用ioctl

来自分类Dev

如何在dd中使用tune2fs?

来自分类Dev

Hadoop fs -cp , says file does not exist?

来自分类Dev

hadoop fs -ls内存不足错误

来自分类Dev

关于hadoop fs测试命令输出

来自分类Dev

hadoop fs -ls内存不足错误

Related 相关文章

  1. 1

    如何在Google Storage的dataproc上执行hadoop fs -getmerge

  2. 2

    Hadoop -getmerge如何工作?

  3. 3

    由于磁盘空间不足,Hadoop fs getmerge到远程服务器/计算机

  4. 4

    hadoop getmerge到另一台机器

  5. 5

    如何在加密的fs上重设密码?

  6. 6

    fs-uae:如何在Linux上加载qemu插件?

  7. 7

    如何在不全局修改fs的情况下(编写库时)执行Promise.promisfyAll(fs)?

  8. 8

    无法从Java执行hadoop fs -put命令

  9. 9

    Kubernaties无法在Google Container Engine上挂载NFS FS

  10. 10

    在hadoop fs -ls上的连接被拒绝

  11. 11

    如何在Node.js中的fs.createWriteStream上拦截回调

  12. 12

    如何在f2fs上加密文件或文件夹?

  13. 13

    如何在 FAT 中运行 Linux 脚本(它不像在 Linux FS 上那样工作)

  14. 14

    如何选择具有反应和电子的fs上的文件?

  15. 15

    如何搜索FS集合?

  16. 16

    如何将AIX上的文件从一个FS复制到另一个FS?

  17. 17

    如何在Google Dataproc上安排Spark作业?

  18. 18

    hdfs dfs -getmerge命令有什么作用?

  19. 19

    如何使用NodeJ中的FS?“我是FS模块”

  20. 20

    “ mke2fs -r fs修订级别”-如何使用?

  21. 21

    如何使用hadoop fs -cp s3:// <bucket> hdfs:/// tmp

  22. 22

    Google Compute Engine VM实例:VFS:无法在未知块上挂载根fs

  23. 23

    当带有 async fs.readdir 的递归函数完成执行时如何得到通知?

  24. 24

    如何在FS_IOC_FIEMAP中使用ioctl

  25. 25

    如何在dd中使用tune2fs?

  26. 26

    Hadoop fs -cp , says file does not exist?

  27. 27

    hadoop fs -ls内存不足错误

  28. 28

    关于hadoop fs测试命令输出

  29. 29

    hadoop fs -ls内存不足错误

热门标签

归档