首页 > 数据库技术 > 详细

Kettle实现SQL Server数据到GreenPlum的每日同步调度

时间:2017-07-30 21:37:34      阅读:484      评论:0      收藏:0      [点我收藏+]

1.总的调度流程,通过linux下的crontab定时执行一个包含kjb执行信息的shell脚本

技术分享

 

2.XXXX_0_Execute_Judge转换下有两个作业,通过获取每天的同步状态值来判断是否执行同步工作,如果同步状态不满足,会发邮件告知

技术分享

 

3.XXXX_A0_Connect_Next作业下含有四个并行执行的作业,Message_Prepare_Yes作业负责的获取到同步状态OK的Email邮件通知

技术分享

 

技术分享

4.四个并行执行的作业分别负责同步不同的模块数据(整个同步原则是小表直接同步,大表通过BCP导出,映射成GP对应的utf-8的txt外部表)

 

技术分享

技术分享

 

技术分享

技术分享

 

5.在所有的模块成功执行完成后,会发送同步完成的邮件通知

技术分享

 

以上只是记录ETL项目的整理框架流程,整个过程比较复杂的地方在于超过十几个G的大表压缩传送,GBK到UTF-8的转码。

 

Kettle实现SQL Server数据到GreenPlum的每日同步调度

原文:http://www.cnblogs.com/binguo2008/p/7260423.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!