首页 > 其他 > 详细

ODS层读数不准问题

时间:2021-06-28 20:13:16      阅读:30      评论:0      收藏:0      [点我收藏+]

原因:

  默认情况下 hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat(切片),此设置的功能是将输入目录的小文件进行切片合并,但是误将lzo.index文件也作为数据,故导致读数不准。

解决:

  不使用CombineHiveInputFormat,使用HiveInputFormat即可,set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat,此设置默认使用表中设置的inputformat进行切片来读数据,使用表的数据格式,这样就不会将索引文件也作为数据处理了

  我们可以在Hive的配置文件中设置(/opt/module/hive/conf/hive-site.xml),设置完成后重启Hive即可

vim /opt/module/hive/conf/hive-site.xml
<!-- 修改CombineHiveInputFormat为HiveInputFormat  -->
<property>
    <name>hive.input.format</name>
    <value>org.apache.hadoop.hive.ql.io.HiveInputFormat</value>
</property>
</configuration>

ODS层读数不准问题

原文:https://www.cnblogs.com/LzMingYueShanPao/p/14945809.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!