首页 > 其他 > 详细

数据仓库与数据挖掘(二)

时间:2018-01-14 22:27:28      阅读:352      评论:0      收藏:0      [点我收藏+]

1、简述数据仓库的设计步骤。

数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。

 

2、简述星型模式和雪花模式的区别。

一个事实、一组维表

一个事实、维表接维表

 

3、数据仓库三种模式之间的关系。

星型、雪花、星座

 

4、在设计数据仓库时,为什么确定事实表的粒度非常重要?

事实与粒度相匹配。

 

5、以下关于数据粒度的叙述中哪些是错误。

(1)粒度是指数据仓库小数据单元的详细程度和级别。

(2)数据越详细,粒度就越小,抽象级别也就越高。

(3)数据综合度越高,粒度就越大,抽象级别也就越高。

(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。

 

6、以下关于数据仓库开发特点的叙述中哪些是错误的。

(1)数据仓库开发要从数据出发。

业务需求

(2)数据仓库使用的需求在开发出来后才会明确。

先明确,再开发。设计时要能够应对未来的变化。

(3)数据仓库开发一个不断循环的过程。

(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。

7、以下关于数据仓库设计的说法中哪些是正确的。

(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。

(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。

(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。

(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。

8、维表中维有哪些类型?

结构维、信息维、分区维、分类维、退化维、一致维、父子维

 

9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?

多级汇总、深入洞察、不同用户不同维、灵活

10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?

节省I/O开销

 

思考:

1、源变化。

急:先处理、再分责

 

2、bottom-up/top-down

top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。

周期长、见效慢;风险高。

bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。

数据逐步清洗提炼。

数据仓库与数据挖掘(二)

原文:https://www.cnblogs.com/moqingtong/p/8284293.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!