首页 > 其他 > 详细

2、小文件问题解决

时间:2018-09-27 00:55:30      阅读:170      评论:0      收藏:0      [点我收藏+]

避免mapper开启过多,导致导致的资源错配,

  1、hive小文件问题

  2、mr编程小文件问题

 

1、hive中的小文件问题

通过shell,产生100个小文件,目录 one100

[centos@s101 ~/one00]$ for((x=1;x<=100;x+=1)); do echo $x,tom$x,$x > $x.txt; done

建表

create table one100(id int,name string,age int)row format delimited fields terminated by ,;

load数据到表one100中

load data local inpath one00/* into table one100;

配置:

set mapred.max.split.size;

默认256000000,

2、小文件问题解决

原文:https://www.cnblogs.com/lybpy/p/9710643.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!