如何调整Hive插入覆盖分区?

威廉·R

我在蜂巢中编写了插入覆盖分区,以将分区中的所有文件合并为更大的文件,

SQL:

SET hive.exec.compress.output=true;
set hive.merge.smallfiles.avgsize=2560000000;
set hive.merge.mapredfiles=true;
set hive.merge.mapfiles =true;
SET mapreduce.max.split.size=256000000;
SET mapreduce.min.split.size=256000000;
SET mapreduce.output.fileoutputformat.compress.type =BLOCK;
SET hive.hadoop.supports.splittable.combineinputformat=true;
SET mapreduce.output.fileoutputformat.compress.codec=${v_compression_codec};

INSERT OVERWRITE TABLE ${source_database}.${table_name} PARTITION (${line}) \n SELECT ${prepare_sel_columns} \n from ${source_database}.${table_name} \n WHERE ${partition_where_clause};\n" 

通过以上设置,我获得了压缩输出,但是生成输出文件所花费的时间太长。

即使它只运行地图作业,也要花费很多时间。

从蜂巢侧寻找任何进一步的设置,以调整“插入”以使其运行更快。

指标。

15 GB文件==>需要10分钟。

威廉·R
SET hive.exec.compress.output=true;
SET mapreduce.input.fileinputformat.split.minsize=512000000; 
SET mapreduce.input.fileinputformat.split.maxsize=5120000000;
SET mapreduce.output.fileoutputformat.compress.type =BLOCK;
SET hive.hadoop.supports.splittable.combineinputformat=true;
SET mapreduce.output.fileoutputformat.compress.codec=${v_compression_codec};

上面的设置非常有用,持续时间从10分钟减少到1分钟。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何调整Hive插入覆盖分区?

来自分类Dev

在Hive表中插入覆盖分区-值重复

来自分类Dev

如何调整/分区的大小?

来自分类Dev

如何调整/分区的大小

来自分类Dev

如何恢复覆盖的分区?

来自分类Dev

Hive从原始外部表插入到动态分区外部表的覆盖失败,出现空指针异常。

来自分类Dev

使用插入覆盖分区进行蜂巢压缩

来自分类Dev

配置单元:插入覆盖多个分区

来自分类Dev

如何调整LVM分区的大小?

来自分类Dev

如何调整大小/ LVM分区

来自分类Dev

如何调整大小/移动分区?

来自分类Dev

如何调整媒体分区的大小?

来自分类Dev

如何调整拙劣的分区大小?

来自分类Dev

如何在 hive 插入分区语句中使用 UDF 值或列值,而不是常量值

来自分类Dev

如何恢复覆盖的NTFS分区?

来自分类Dev

HIVE-使用WITH CLAUSE插入覆盖

来自分类Dev

HIVE插入json格式的覆盖目录

来自分类Dev

Hive分区,存储桶和排序表-多次插入

来自分类Dev

在 Hive 中插入带有分区字段的数据列表列

来自分类Dev

如何调整此ubuntu分区的大小?

来自分类Dev

如何调整FileVault 2加密分区的大小?

来自分类Dev

如何调整分区和文件系统的大小?

来自分类Dev

如何调整活动LVM分区的大小?

来自分类Dev

如何使用gparted调整分区大小?

来自分类Dev

如何调整由LVM管理的分区的大小?

来自分类Dev

如何调整和缩小BTRFS分区的大小?

来自分类Dev

如何调整硬盘分区的大小

来自分类Dev

如何调整没有分区的磁盘的大小?

来自分类Dev

如何调整“ Linux LVM”分区中分区的大小