首页 > 编程语言 > 详细

[Hive_9] Hive 的排序

时间:2019-01-12 15:47:33      阅读:60      评论:0      收藏:0      [点我收藏+]

标签:reat   clas   eight   sel   16px   row   int   hash分区   pro   


0. 说明

 

 


1. 前期准备

  1.1 建表

create table user_order(id int, name string, age int, province string, city string)
row format delimited
fields terminated by \t;

 

  1.2 设置 reduce 个数

set mapreduce.job.reduces=2;

 

 

2. 全排序(order by)


   一个 reduce,在真实使用中,需要加 limit 限制。

truncate table user_order;
insert into user_order select * from user_par order by id;

 


 

3. 部分排序(sort by )

  在每个 reduce 中分别排序

truncate table user_order;

insert into user_order select * from user_par sort by id;

 


 

 

4. hash分区(distribute by )

 

truncate table user_order;

insert into user_order select * from user_par distribute by id;

 


 


cluster by = distribute by + sort by
truncate table user_order;
insert into user_order select * from user_par cluster by id;

 

 

 

 

 


 

[Hive_9] Hive 的排序

标签:reat   clas   eight   sel   16px   row   int   hash分区   pro   

原文:https://www.cnblogs.com/share23/p/10259896.html

(0)
(0)
   
举报
评论 一句话评论(0
0条  
登录后才能评论!
© 2014 bubuko.com 版权所有 鲁ICP备09046678号-4
打开技术之扣,分享程序人生!
             

鲁公网安备 37021202000002号