假设使用默认的Hadoop设置,如果我正在将128 MB大小的文件写入HDFS。客户端需要将2个块写入HDFS。所以我对此的疑问是
第二种情况是文件大小为64 MB,
2.有人可以读取当前写入HDFS的块吗?否则必须等待写入完成。
HDFS以块为单位进行思考。
因此,如果文件由2个块组成,并且写入了一个块,则可以读取该块。但是,由于它只是文件的一部分,而不是整个文件的一部分,因此您必须在中搜索它dfs.data.dir
并使用hadoop dfs -text
它来读取它。或者您可以去namenode UI
阅读它。
对于第二个问题-不,您无法读取当前正在写入的块。它不会对读者可见。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句