首页 > 其他 > 详细

数仓的分层

时间:2020-04-04 17:30:04      阅读:70      评论:0      收藏:0      [点我收藏+]

一、数仓为什么要分层?

1、分层解耦,可以让开发思路更加清晰,复杂问题简单化(出错时,可以精确定位数据)

2、节省重复开发

3、脱敏

 

二、数仓的分层

以5层数仓为例

ODS层:原始数据层,原始数据原封不动的直接导入!

DWD层:基于ODS层,将原始数据进行清洗,筛选后的数据,把其中的明细打开

  例如:启动日志原始数据:{t:xxx,ba:xxx}

  展开后,可以获得具体每个字段的值,

DWS层:为后续的分析提供数据服务,基于DWD层,将DWD层的数据按天进行聚合!

  例如:统计每天新增的用户,每天的订单量,每天的交易额

DWT层:选择一个主题,以主题为核心,将和这个主题所有相关的核心数据,进行导入

  例如:以用户为主题,将和用户相关的所有信息(新增用户数,用户下单数,用户评论数,用户点赞数,用户使用优惠券数等)进行汇总。

ADS层:基于DWT层,统计具体报表需要的结果

 

数仓的分层

原文:https://www.cnblogs.com/atBruce/p/12632459.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!