首页 > 其他 > 详细

数据仓库小记(一)

时间:2018-01-16 22:55:30      阅读:313      评论:0      收藏:0      [点我收藏+]

什么是数据仓库?

宽泛地讲,数据仓库是一种数据库,它与单位的操作数据库分别维护。数据库允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。

William H.Inmon 说过(数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理者的决策过程)

 技术分享图片技术分享图片

操作数据库系统与数据仓库的区别?

联机操作数据库系统的主要任务是执行联机事务和查询处理。这种系统称作联机事务处理(OLTP)系统。它们涵盖了单位的大部分日常操作。

数据仓库系统在数据分析和决策方面为用户或”知识工人”提供服务。这种系统可以用不同的格式组织和提供数据,以便满足不同用户形形色色的需求。这种系统称作联机分析处理(OLAP)系统(知识工人指的是例如经理、分析人员和主管)

 技术分享图片

OLTP系统和OLAP系统的比较:

技术分享图片

数据仓库:一种多层体系结构。

通常,数据仓库采用三层体系结构,如下图:

底层是仓库数据库服务器,中间层是OLAP服务器,顶层是前段客户层

 技术分享图片

数据仓库模型:企业仓库、数据集市、虚拟仓库

从结构的角度来看,有三种数据仓库模型:企业仓库、数据集市和虚拟仓库。

企业仓库:企业仓库搜集了关于主题的所有信息,跨越整个企业。它提供企业范围内的数据集成,通常来自一个或多个操作数据库系统或外部信息提供者,并且是多功能的。

企业数据仓库可以在传统的大型机、超级计算机服务器或并行结构平台上实现。它需要广泛的商务建模,可能需要多年涉及和建设。

数据集市:数据集市包含企业范围数据的一个子集,对于特定的用户群是有用的。有范围限于选定的主题。例如,销售数据集市可能限定其主题为顾客、商品和销售。包括在数据集市中的数据通常是汇总的。

根据数据来源不同,数据集市分为独立和依赖的两类。在独立的数据集市中,数据是来自一个或多个操作数据库系统或外部信息提供者,或者来自在一个特定的部门或地区局部产生的数据。依赖的数据集市的数据直接来自企业数据仓库。

数据集市可以在低价格的部门服务器上实现,基于UNIX/LinuxWindows。数据集市的实现周期一般是数以周计的。

虚拟仓库:虚拟仓库是操作数据库上视图的集合。为了有效地处理查询,只有一些可能的汇总视图被物化。虚拟仓库易于建立,但需要操作数据库服务器还有余力。

 

数据仓库小记(一)

原文:https://www.cnblogs.com/wyfloveyanqi/p/8297464.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!