首页 > 其他 > 详细

hive 中的拉链表 2

时间:2017-03-01 21:48:29      阅读:412      评论:0      收藏:0      [点我收藏+]

本例以hive为例,只考虑到实现,与性能无关

首先创建表

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
CREATE TABLE orders (
orderid INT,
createtime STRING,
modifiedtime STRING,
status STRING
) row format delimited fields terminated by ‘\t‘
 
 
CREATE TABLE ods_orders_inc (
orderid INT,
createtime STRING,
modifiedtime STRING,
status STRING
) PARTITIONED BY (day STRING)
row format delimited fields terminated by ‘\t‘
 
 
CREATE TABLE dw_orders_his (
orderid INT,
createtime STRING,
modifiedtime STRING,
status STRING,
dw_start_date STRING,
dw_end_date STRING
) row format delimited fields terminated by ‘\t‘ ;

首先全量更新,我们先到2016-08-20为止的数据。

初始化,先把2016-08-20的数据初始化进去

1
2
3
4
INSERT overwrite TABLE ods_orders_inc PARTITION (day ‘2016-08-20‘)
SELECT orderid,createtime,modifiedtime,status
FROM orders
WHERE createtime < ‘2016-08-21‘ and modifiedtime <‘2016-08-21‘;

刷到dw中

1
2
3
4
5
6
INSERT overwrite TABLE dw_orders_his
SELECT orderid,createtime,modifiedtime,status,
createtime AS dw_start_date,
‘9999-12-31‘ AS dw_end_date
FROM ods_orders_inc
WHERE day ‘2016-08-20‘;

如下结果

1
2
3
4
5
select from dw_orders_his;
OK
1  2016-08-20  2016-08-20  创建 2016-08-20  9999-12-31
2  2016-08-20  2016-08-20  创建 2016-08-20  9999-12-31
3  2016-08-20  2016-08-20  创建 2016-08-20  9999-12-31

hive 中的拉链表 2

原文:http://jackwxh.blog.51cto.com/2850597/1902347

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!