了解Hive中的分区

debugcn 发表于 Dev

斯内汉苏

我正在尝试学习Hive，并在参考《 Hadoop权威指南》时感到有些困惑。

根据文本，Hive中的分区是通过创建与partitioning column具有相同值的子目录来完成的。但是，就像在Hive中一样，数据加载只是意味着复制文件，并且在加载期间不执行任何数据验证检查，而仅在查询期间，Hive也会检查数据是否进行分区。或如何确定应将哪个文件转到哪个目录？

海梅·卡法雷尔（Jaime Caffarel）

或如何确定应将哪个文件转到哪个目录？

不需要，您必须在LOAD DATA命令中设置目标分区的值。LOAD对分区表执行操作时，必须通过参数指定要在其中加载数据的特定分区（目录）PARTITION。根据文档：

加载到的目标可以是表或分区。如果表已分区，则必须通过为所有分区列指定值来指定表的特定分区。

例如，在此示例中：

  hive> LOAD DATA LOCAL INPATH './examples/files/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-15');
  hive> LOAD DATA LOCAL INPATH './examples/files/kv3.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-08');

这两个文件将存储在invites/ds=2008-08-15和invites/ds=2008-08-08文件夹中。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-28

我来说两句

0条评论

登录后参与评论

来自分类Dev

在Hive中删除分区

来自分类Dev

Hive中的分区交换

来自分类Dev

Hive 中的时间戳分区

来自分类Dev

了解从 Cassandra 中的单个分区读取

来自分类Dev

了解双启动中的数据分区

来自分类Dev

Hive中动态分区和静态分区的主要区别

来自分类Dev

需要了解Dataframe Spark中的分区详细信息

来自分类Dev

帮助了解分区角色

来自分类Dev

了解syslinux和分区

来自分类Dev

无法对Hive中的海量数据集应用动态分区

来自分类Dev

在Hive表中插入覆盖分区-值重复

来自分类Dev

在Pig中读取非字符串分区的Hive表

来自分类Dev

是否可以在HIVE中更改分区元数据？

来自分类Dev

分区的ORC表在Hive中显示为空

来自分类Dev

无法对Hive中的海量数据集应用动态分区

来自分类Dev

Hive-动态分区错误中面临的挑战

来自分类Dev

从Hive中的选择查询中排除分区字段

来自分类Dev

Hive中的外部表可以智能识别分区吗？

来自分类Dev

如何在Hive中重命名分区值？

来自分类Dev

在 Hive 中插入带有分区字段的数据列表列

来自分类Dev

从Hive视图加载Hive分区

来自分类Dev

如何在Hive中获取表是按动态分区还是静态分区

来自分类Dev

从HDFS手动删除分区数据后，如何更新Hive中的分区元数据

来自分类Dev

从HDFS手动删除分区数据后，如何更新Hive中的分区元数据

来自分类Dev

创建Hive外部表，路径中没有分区列名称的分区？

来自分类Dev

Hive静态分区问题

来自分类Dev

基于Hive日期的分区

来自分类Dev

Hive：动态分区

来自分类Dev

Hive - 忽略丢失的分区

Related 相关文章

文章