在google搜索得出的解决方案是在执行的hive语句前添加以下几条参数值设定语句:
set mapreduce.job.reduces=512;
set hive.groupby.skewindata=true;
set hive.optimize.skewjoin=true;
set hive.skewjoin.key=5000;
set hive.groupby.mapaggr.checkinterval=5000;
原文:https://www.cnblogs.com/linuxws/p/10780966.html