Hadoop：删除/tmp/logs/hive/logs/hive 下的文件夹会发生什么

debugcn 发表于 Dev

斋藤由纪

从 Cloudera Manager 安装 CDH 5.3 版。

我的集群使用 hive，其他服务设置是这样的：
・yarn.nodemanager.remote-app-log-dir=/tmp/logs ・yarn.nodemanager.remote-app-log-dir-suffix=logs ・replication setting is 2

我在删除/tmp/logs/hive/logs/.
尤其/tmp/logs/hive/logs/hive

我尝试/tmp/logs/hive/logs/hive/xxxxxxx.xxxxxxx使用 hdfs 命令删除，但文件夹太大而无法删除。

甚至hadoop fs -ls /tmp/logs/hive/logs/hive/没有工作......（hdfs没有回答。（大小几乎是3TB））

因此，我决定使用 [Hadoop fs -rmr /tmp/logs/hive/logs/hive/*]。但是，我不知道如果我使用这个命令我的集群会发生什么（我担心某个地方将无法访问，因为这个）。

有什么问题吗？或者有一个好主意来处理这个问题（我不想重启我的集群）。

萨姆森·沙弗里希特

HDFS 目录/tmp/logs是 Mapreduce日志聚合的默认位置；还有另一个关键属性是......

yarn.log-aggregation.retain-seconds: 在删除聚合日志之前等待多长时间，-1 或负数禁用聚合日志的删除。
需要小心，不要将此值设置得太小，以免给分布式文件系统带来负担。

https://fr.hortonworks.com/blog/simplifying-user-logs-management-and-access-in-yarn/

典型的集群会在 5 到 30 天后清除 MR 日志，具体取决于活动（以及合规性要求）。如果你从不清除任何东西，那么你迟早会撞墙......！

OK，如果你真的需要手动清除这些东西集体，你可以做到这一点。从清除 - 无不清除 - 一切，但无论如何，残酷地切换有点荒谬。

对于上面的博客文章，您可以注意到/tmp/logs必须将访问权限设置为 1777，即“用户读/写/执行、组读/写/执行、其他读/写/执行和粘滞位设置”（就像/tmp）；并且其组所有权必须与运行 NodeManager 服务的服务帐户的主要组匹配。

换句话说：任何人都可以在那里创建子目录；粘性位和组所有权技巧意味着 YARN 和创建者都可以读/写/清除其中的日志文件——但其他人不能。

现在有趣的部分是，新用户启动其第一个 MapReduce 作业将自动创建一个以他/她命名的新子目录，以及一个logs/子子目录；并且 HiveServer2 在hive服务帐户下运行的第一个查询会自动创建hive/和hive/logs/子目录。
=> 如果您删除这些子目录，它们将在下次运行时自动重新创建
=> 但是如果您在HS2 会话运行查询时删除它们，那么当尝试将其日志推送到 HDFS 时，该查询可能会崩溃并烧毁！

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-14

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

Hadoop：删除/tmp/logs/hive/logs/hive 下的文件夹会发生什么

Hadoop：删除/tmp/logs/hive/logs/hive 下的文件夹会发生什么

Java删除，编辑和更改文件夹中的文件时会发生什么？

Windows 7-删除AppData文件夹时会发生什么？

hadoop日志文件夹中的.out文件是什么？删除它们安全吗？

在sh循环的“ for for in in”中间添加/删除文件时会发生什么？

删除铲子会发生什么

如何避免删除 /run 或 /var/run 下的文件夹

为什么只删除某些文件和文件夹？

为什么只删除某些文件和文件夹？

为什么DirectoryInfo实例在删除文件夹后不创建（重新）文件夹？

为什么不能删除此文件夹（VBA）？

zsh：如何在不删除文件夹的情况下删除文件夹中的内容？

如果-111一次超过600个文件夹会发生什么？

当您“挂载”带有内容的现有文件夹时会发生什么？

递归删除WP8中的文件和文件夹时发生异常

删除后指针本身会发生什么？

删除/ tmp分区，会发生什么？

删除当前目录后会发生什么？

如果从类文件中删除超级构造函数调用，会发生什么？

从Terraform配置文件中删除资源时会发生什么

已删除24gb文件，但未更改可用空间。会发生什么事？

如果从类文件中删除超级构造函数调用，会发生什么情况？

当您删除Windows 10更新文件并尝试重置PC时会发生什么？

如果我删除sources.list.d中的.list文件，会发生什么？

删除文件时会发生什么？磁盘空间是减少还是保持不变？

如果 /etc/fstab 条目中的文件系统被用户删除会发生什么？

如果我删除Rabbitmq的“.erlang.cookie”文件会发生什么？

如果我删除了 C++ 程序正在向其写入数据的文件，会发生什么？

为什么我无法在hadoop hdfs的父文件夹结构内创建子文件夹？

如何删除文件夹