首页 > 其他 > 详细

复工指数项目流程

时间:2020-04-03 11:28:01      阅读:62      评论:0      收藏:0      [点我收藏+]

流程图如下:

 技术分享图片

 

 

说明:

1: OGG同步表清单

 

表名

注释

数据量

表大小/GB

SH_LOSS_MID.LOSS_YC_MRCJDLDJSJ_CONSGZB

日冻结电量

8900467833

561.39

SH_LOSS.C_METER_MP_RELA

表计关系表

13778340

0.7

SH_LOSS.C_MP

计量点

12016874

2.83

SH_LOSS.C_METER

表计信息

13766620

2.05

SH_LOSS.LOSS_ARCH_REL_TG_TRAN

台变关系表

139036

0.02

SH_LOSS.LOSS_ARCH_REL_YXMP_PDTRAN

台户关系表

11050530

1.98

SH_LOSS.C_CONS

用户表

12690949

1.68

 

 

2: OGG安装位置 /home/goldengate/

Ogg复制进程主要有repsa,repsb .

Rpesa 进程同步表为SH_LOSS.C_METER_MP_RELA

SH_LOSS.C_MP

SH_LOSS.C_METER

SH_LOSS.LOSS_ARCH_REL_TG_TRAN

SH_LOSS.LOSS_ARCH_REL_YXMP_PDTRAN

SH_LOSS.C_CONS

Repsb 进程同步表为LOSS_YC_MRCJDLDJSJ_CONSGZB

 

3:ETL进程

ETL进程主要是调用sp_c_read_gsy_flatten, sp_c_read_gsy_flatten_add两个存储过程,将源数据清洗进GSY目标大宽表中.

 

4:FDA数据清洗

FDA数据清洗主要是将GSY大宽表中的数据先导出成txt文件(为了使处理速度达到最优,最好每个文件大小为20M左右),再在星环大数据平台中使用discover工具,调用相关R程序脚本进行数据清洗.成功后在将数据导入到星环大数据云平台.

 

复工指数项目流程

原文:https://www.cnblogs.com/qfdy123/p/12625227.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!