首页 > 编程语言 > 详细

全排序

时间:2018-07-28 14:27:22      阅读:112      评论:0      收藏:0      [点我收藏+]

描述的是reduce个数大于1的情况。全排序就是生存的多个文件里面都是按顺序的所有的文件的数据也是按顺序的。

1.思路

  a.修改分区partition算法,默认是HashPartition;

    例如:

      

public int getPartition(LongWritable key, Text value, int numPartitions) {
  if(key.get() >1000){
    return 0;
  }else if(key.get()>500 && key.get()<=1000){
    return 1;
  }else{
    return 2;
  }
}

 

    问题:数据边界

  b.采用InputSample和TotalOrderPartition来实现动态分区;

全排序

原文:https://www.cnblogs.com/lyr999736/p/9381657.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!