除了使用 Cloudera Navigator,我如何才能在 HDFS 中找到不常访问的文件。
我假设您正在寻找上次访问文件的时间(打开、读取等),因为过去时间越长,访问文件的次数就越少。
因此,您可以通过ls -l -someMoreOptions在 Linux 中非常简单地完成此操作,但在 HDFS 中需要做更多工作。
也许您可以监视上述文件的/hdfs-audit.log
for cmd=open
。或者,您可以实现一个小函数来读出FileStatus.getAccessTime()
和 ,如在是否有办法获取 HDFS 文件的最后访问时间?或如何获取 HDFS 中任何文件的最后访问时间?在 Cloudera 社区中。
换句话说,有必要创建一个小程序来扫描所有文件,读出属性
...
status = fs.getFileStatus(new Path(line));
...
long lastAccessTimeLong = status.getAccessTime();
Date lastAccessTimeDate = new Date(lastAccessTimeLong);
...
并订购它。您将能够找到长时间未访问的文件。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句