数据仓库(DW)是一个收集和管理不同来源的数据,以提供有意义的业务洞察力的过程。数据仓库通常用于连接和分析来自不同来源的业务数据。数据仓库是商业智能系统的核心,它是为数据分析和报告而建立的。
数据仓库系统也被称为以下名称。
随着计算机系统变得更加复杂,需要处理越来越多的信息量,对数据仓库的需求也随之发展。然而,数据仓库并不是一个新事物,以下是数据仓库演变的一些主要事件
数据仓库的工作原理是作为一个中央存储库,信息从一个或多个数据源传来。数据从事务系统和其他关系型数据库流入数据仓库。数据可以是
数据经过处理、转换和录入,用户可以通过商业智能工具、SQL客户端和电子表格访问数据仓库中的处理后的数据。数据仓库将来自不同来源的信息合并到一个综合数据库中。通过将所有这些信息合并到一个地方,企业可以更全面地分析其客户。这有助于确保它考虑了所有可用的信息,数据仓库使数据挖掘成为可能,数据挖掘就是在数据中寻找可能导致销售和利润提高的模式。
数据仓库主要有三种类型。
企业数据仓库是一个集中式的仓库。它为整个企业提供决策支持服务。它提供了统一的组织和表示数据的方法。它还提供了根据主题对数据进行分类的能力,并根据这些划分给予访问权限。
操作数据存储,也叫ODS,无非是当数据仓库和OLTP系统都不能支持组织的报表需求时,所需要的数据存储。在ODS中,数据仓库是实时刷新的。因此,它被广泛用于存储员工的记录等日常活动。
数据集市:数据集市是数据仓库的一个子集。它是专门为某一特定的业务线而设计的,如销售、财务、销售或财务等。在独立的数据集市中,数据可以直接从数据源采集。
早期,企业开始相对简单地使用数据仓库。然而,随着时间的推移,数据仓库开始了更复杂的使用。
以下是数据仓库的一般阶段。
在这个阶段,数据只是将数据从操作系统复制到另一台服务器上。在这种方式下,复制后的数据的加载、处理和报告不会影响到业务系统的性能。
数据仓库中的数据是定期从业务数据库中更新的。数据仓库中的数据经过映射和转化,满足数据仓库的目标。
在这个阶段,数据仓库中的数据会在业务数据库中发生任何交易时更新。例如,航空公司或铁路订票系统。
数据仓库的四个组成部分是。
加载管理器也被称为前部组件。它执行与数据提取和加载到仓库中的数据相关的所有操作。这些操作包括转换,为数据进入数据仓库做准备。
仓库管理器执行与仓库中的数据管理相关的操作。它执行的操作包括分析数据以确保一致性,创建索引和视图,生成去正则化和聚合,源数据的转换和合并,以及数据的归档和加工。
查询管理器也被称为后端组件。它执行所有与用户查询管理相关的操作操作。该数据仓库组件的操作是直接查询到相应的表。
主要分为五大类
数据仓库是所有类型的用户所需要的。
以下是最常见的数据仓库应用的行业。
在航空公司系统中,它主要用于运营目的,如机组人员分配、航线收益分析、常客计划促销等。
银行业:广泛应用于银行业,有效地管理的可用资源。部分银行还用于市场调研、产品性能分析和运营。
医疗行业:医疗行业也使用数据仓库来制定策略和预测结果,生成患者的治疗报告,与保险公司、医疗救助服务等合作方共享数据。
在公共部门,数据仓库被用于情报收集。它可以帮助政府机构维护和分析每个人的税务记录、健康政策记录等。
在这个行业,数据仓库主要用于分析数据模式、客户趋势,以及跟踪市场动向等。
在连锁零售行业,数据仓库被广泛用于配送和营销。它还有助于跟踪商品、顾客购买模式、促销活动,也可用于确定价格政策。
在这个行业中,数据仓库被用于产品促销、销售决策和分销决策。
该行业利用仓库服务来设计和估计他们的广告和促销活动,根据客户的反馈和旅行模式来确定目标客户。
解决与数据仓库实施相关的业务风险的最佳方法是采用以下三管齐下的策略
技术选型,包括当前的架构和工具。确定事实、维度和属性,同时进行数据映射和转化工作。
数据仓库应该根据主题领域分阶段实施。相关的业务实体,如预订、计费等,应该先实现,然后再相互集成。
与其大刀阔斧地实施,不如迭代开发和测试数据仓库。
步骤 |
任务 |
可完成的任务 |
1 |
需要确定项目范围定义 |
范围定义 |
2 |
需要确定业务需求 |
逻辑数据模型 |
3 |
定义操作性数据存储要求 |
操作性数据存储模型 |
4 |
获取或开发提取工具 |
提取工具和软件 |
5 |
定义数据仓库的数据需求 |
过渡数据模型 |
6 |
记录缺失的数据 |
待办项目清单 |
7 |
业务数据存储到数据仓库 |
D/W数据集成地图 |
8 |
开发数据仓库 |
D/W数据库设计 |
9 |
从操作数据存储中提取数据 |
D/W数据提取 |
10 |
加载数据仓库 |
初始数据加载 |
11 |
维护数据仓库 |
持续更新迭代与维护 |
参考资料:
What Is Data Warehousing? Types, Definition & Example
原文:https://www.cnblogs.com/purple5252/p/13132371.html