我们的hadoop集群,使用snappy作为默认编解码器。Hadoop作业减少输出文件名就好part-r-00000.snappy
。JSnappy无法解压缩文件bcz JSnappy要求文件以SNZ开头。reduce输出文件以某种方式从某些字节0开始。
如何解压缩文件?
使用“ Hadoop fs -text”读取此文件并将其通过管道传输到txt文件。例如:
hadoop fs -text part-r-00001.snappy> /tmp/mydatafile.txt
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句