从HDFS手动删除分区数据后,如何更新Hive中的分区元数据

19年级

自动更新Hive分区表的元数据的方式是什么?

如果将新的分区数据添加到HDFS(不添加alter table,则添加分区命令执行)。然后我们可以通过执行“ msck repair”命令来同步元数据。

如果从HDFS中删除了许多分区数据(未执行alter table drop partition commad执行),该怎么办。

同步Hive元数据的方式是什么?

切索

编辑:从Hive 3.0.0 开始,MSCK现在可以使用以下语法发现新分区或删除丢失的分区(或同时删除这两个分区):

MSCK [REPAIR] TABLE table_name [ADD/DROP/SYNC PARTITIONS]

这已在HIVE-17824中实施


正如HakkiBuyukcengiz正确指出的那样MSCK REPAIR如果手动删除了HDFS上的相应文件夹则不会删除分区,而仅在创建新文件夹时才添加分区

从官方文档中摘录

换句话说,它将把存在于HDFS上但不在元存储中的任何分区添加到元存储中。

external如果在HDFS上手动删除了多个分区文件夹,而我想快速刷新分区,这通常是在有的情况下执行的操作:

  • 删除表(DROP TABLE table_name)(删除外部表不会删除基础分区文件)
  • 重新建立表格(CREATE EXTERNAL TABLE table_name ...
  • 修理(MSCK REPAIR TABLE table_name

根据分区的数量,这可能需要很长时间。另一种解决方案是ALTER TABLE DROP PARTITION (...)对每个删除的分区文件夹使用,但是如果删除了多个分区,这可能很麻烦。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从HDFS手动删除分区数据后,如何更新Hive中的分区元数据

来自分类Dev

手动删除分区后无法安装Ubuntu

来自分类Dev

如何手动挂载分区?

来自分类Dev

当通过使用alter drop命令删除分区时,如何从配置单元中删除分区元数据

来自分类Dev

分区表后,如何查看每个分区中的数据

来自分类Dev

是否可以在HIVE中更改分区元数据?

来自分类Dev

Spark RDD关联性/分区与数据的手动配置

来自分类Dev

如何手动删除SQL Azure数据同步对象

来自分类Dev

手动从余烬数据存储中删除记录

来自分类Dev

如何手动设置启动选项以从特定分区启动?

来自分类Dev

我应该如何使用手动分区?

来自分类Dev

如何手动修复分区表?

来自分类Dev

如何手动更改分区类型GUID

来自分类Dev

在安装过程中如何使用手动分区?

来自分类Dev

在安装过程中如何使用手动分区?

来自分类Dev

如何使用 Spark 从 Hive 表中截断数据并删除所有分区

来自分类Dev

如何在RabbitMQ中手动提取队列数据?

来自分类Dev

如何在SAS EG中手动输入数据

来自分类Dev

如何防止在DB中手动编辑数据?

来自分类Dev

如何在RabbitMQ中手动提取队列数据?

来自分类Dev

在Hive中删除分区

来自分类Dev

mysql-表分区与“手动”表分区

来自分类Dev

删除分区后恢复硬盘数据

来自分类Dev

是否可以通过Fastparquet阅读器使用Dask读取手动分区的Parquet数据集?

来自分类Dev

无法联系hive表分区,删除与分区相关的hdfs文件后

来自分类Dev

手动删除pip包后如何删除

来自分类Dev

Oracle Coherence后写式高速缓存和手动数据库更新

来自分类Dev

如何删除数据帧中的空分区?

来自分类Dev

使用Linux可引导光盘删除HDD分区:从Shell / CUI环境手动进行

Related 相关文章

  1. 1

    从HDFS手动删除分区数据后,如何更新Hive中的分区元数据

  2. 2

    手动删除分区后无法安装Ubuntu

  3. 3

    如何手动挂载分区?

  4. 4

    当通过使用alter drop命令删除分区时,如何从配置单元中删除分区元数据

  5. 5

    分区表后,如何查看每个分区中的数据

  6. 6

    是否可以在HIVE中更改分区元数据?

  7. 7

    Spark RDD关联性/分区与数据的手动配置

  8. 8

    如何手动删除SQL Azure数据同步对象

  9. 9

    手动从余烬数据存储中删除记录

  10. 10

    如何手动设置启动选项以从特定分区启动?

  11. 11

    我应该如何使用手动分区?

  12. 12

    如何手动修复分区表?

  13. 13

    如何手动更改分区类型GUID

  14. 14

    在安装过程中如何使用手动分区?

  15. 15

    在安装过程中如何使用手动分区?

  16. 16

    如何使用 Spark 从 Hive 表中截断数据并删除所有分区

  17. 17

    如何在RabbitMQ中手动提取队列数据?

  18. 18

    如何在SAS EG中手动输入数据

  19. 19

    如何防止在DB中手动编辑数据?

  20. 20

    如何在RabbitMQ中手动提取队列数据?

  21. 21

    在Hive中删除分区

  22. 22

    mysql-表分区与“手动”表分区

  23. 23

    删除分区后恢复硬盘数据

  24. 24

    是否可以通过Fastparquet阅读器使用Dask读取手动分区的Parquet数据集?

  25. 25

    无法联系hive表分区,删除与分区相关的hdfs文件后

  26. 26

    手动删除pip包后如何删除

  27. 27

    Oracle Coherence后写式高速缓存和手动数据库更新

  28. 28

    如何删除数据帧中的空分区?

  29. 29

    使用Linux可引导光盘删除HDD分区:从Shell / CUI环境手动进行

热门标签

归档