tez得文件生成个数与什么有关?

文章探讨了在HiveonTez环境下,如何调整参数如hive.tez.cpu.vcores,mapred.reduce.tasks,hive.exec.reducers.bytes.per.reducer和hive.merge.tezfiles来控制文件的生成数量。尽管尝试了不同设置,但测试结果始终未改变,生成11个文件。作者怀疑可能是环境配置问题,并邀请读者进行测试验证。

之前研究过hive on spark,最后的文件生成个数
hive-mapJoin和skewJoin-CSDN博客
现在在cdp了 使用的是hive on tez。也在学习下这个文件的生成个数与什么有关?

以该表为例 有11个文件 每个差不多60M左右 总共620M左右。

 我们先想下 哪些参数和生成的文件数有关?

set hive.tez.cpu.vcores   --好像是tez处理时用的core 类似spark的core 默认没有

set mapred.reduce.tasks=10  --reduce的个数 默认-1

set hive.exec.reducers.bytes.per.reducer=67108864 --默认64M

set hive.merge.tezfiles=false  --合并小文件 默认false

-- set mapreduce.reduce.cpu.vcores=1 --reduce使用的core 默认1  这个参数在set找得到但是官网和hive的文档里找不到,不做考虑

distribute by 

order by 

来点参数说明

hive.tez.cpu.vcores

  • Default Value: <
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值