最近打算阅读一下数据仓库相关的书籍,百度了一下,有两本必读书《数据仓库工具箱》和《数据仓库》。简单介绍一下,《数据仓库》这本书更像是一本教材,里面的内容很经典;《数据仓库工具箱》看书名是一本单纯的工具书,其实里面都是实战。两本书各有千秋,我决定主要阅读《数据仓库工具箱》,今天分享第一章的内容,以后会做系列分享。
第一章主要介绍了维度建模的好处,Kimball的历史和技术架构,以及与其他类似架构的优劣,但其核心议题是:“如何做好数据仓库?”
说实话这个议题很没意思,有些枯燥,可是如果你遇到:“如何才能做好数据?为什么需求一直做不完?数据的价值到底有多大?”那么这下面全是干货。
上面7点是数据仓库设计的目标,不过重点是最后两点
这个是核心,我刚开始做数据仓库的时候,设定的目标是:满足业务查询数据的需求。结果我在这个目标上不断的奔跑,差点累死。暂且不提几十个维度做笛卡尔积的查询能否实现,就算做出来了,价值是什么哪?为公司带来了多少收益?如果自己的价值不能量化,那么结果是可以想象的。所以一定要数据仓库一定要支持决策,并且知道自己支持了哪些决策。下面是书中原文:
数据仓库需要正确的信息以支持决策制定。DW/BI系统最重要的输出是基于分析证据所产生的决策。这些决策体现了数据仓库的影响和价值。早期用于表示DW/BI系统的称谓--决策支持系统,仍可作为开展系统设计的最好描述。
技术方案不重要,落地才重要,这里我想说的是:可以不用那些高大上的技术方案,但是不能不知道它的原理。要即知道它的优点,也知道它的不适用。
是否使用最佳组合产品或平台来构建您的体面的解决方案其实并不重要。如果业务群体不能接受DW/BI环境并积极使用它,就难言成功。对操作型系统来说,用户无法对其加以选择,只能使用新系统,而对DW/BI系统来说,与操作型系统不同的是,它是可选的。
只有当DW/BI系统真正成为用于构建可付诸实现的信息的"简单快捷"的资源时,用户才会接受它。
这里的责任大都是如何满足用户的需求,满足用户的需求不等于他提的需求都要做,而是充分理解他的kpi,理解他的目标,从这个方面入手满足他的需求,下面是原文:
一、理解业务用户 1.1 理解他们的工作责任、目标和任务。 1.2 确定商业用户在制定哪些决策时需要DW/BI系统的帮助。 1.3 识别出那些制定出高效率、高影响的决策的"最佳"用户。 1.4 发现潜在的新用户,并让他们意识到DW/BI系统能够给他们带来什么能力。 二、对业务用户发布高质量、相关的、可访问的信息和分析 2.1 选择最健壮的、可操作的数据放入DW/BI系统中,从组织机构的各种数据源中仔细选择 2.2 简化用户接口和应用,采用模板驱动方式,与用户的认知过程轮廓匹配 2.3 确保数据精确、可信,使其标识在整个企业具有一致性。 2.4 不间断地监控数据和分析的准确性。 2.5 适应用户不断变化的思维方式、需求和业务优先级,及新数据源的可用性。 三、维护DW/BI环境 3.1 采用DW/BI系统制定的成功的业务决策,验证人员配置及要投入的开支。 3.2 定期对DW/BI系统进行更新。 3.3 保持业务用户的信任。 3.4 保持业务用户、执行赞助商和IT管理层满意度。
原文:http://www.cnblogs.com/liqiu/p/7113452.html