数据仓库工具箱第3版豆瓣百度网盘-数据仓库工具箱第三版PDF电子版下载

数据仓库工具箱第3版豆瓣百度网盘-数据仓库工具箱第三版PDF电子版下载

编辑点评:

大数据应用与技术丛书·数据仓库工具箱(第3版):维度建模权威指南的写作是以案例研究为本体,根据应用的需求提出解决方案。针对应用中反映出来的问题,适时提出相关技术和方法。许多问题对于应用开发者来说都似曾相识,例如对于缓慢变化维度的探讨

数据仓库工具箱第三版PDF电子版下载

内容简介

随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。 

该书汇集了到目前为止全面的维度建模技术。 

该书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。 

该书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。 

该书主要内容: 

实用设计技术——有关维度和事实表的基本和高级技术。 

14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等。 

为12个案例研究提供了数据仓库总线矩阵示例。 

需要避免的维度建模陷阱和错误。 

增强的缓慢变化维度(SCD)技术类型0~类型7。 

用于处理参差不齐的可变深度层次和多值属性的桥接表大数据分析的实践。与业务参与方合作、交互设计会议的指南。 

有关KimballDW/BI项目生命周期方法论的概论。 

对ETL系统和设计思考的总结构建维度和事实表的34个ETL子系统和技术。

作者简介

Ralph Kimball是Kimball集团的创建者。从20世纪80年代中期以来,他一直是数据仓库和商业智能行业维度建模方法的思想开拓者。大量IT专业人士接受过其教育。自1996年以来,由他及其同事们所撰写的工具箱系列书籍一直是最受读者青睐的书籍。Ralph Kimball曾就职于Metaphor并建立了Red Brick系统,他在施乐Palo Alto研究中心(PARC)

工作期间,与他人一起共同发明了星型工作站,这是首个利用视窗、图标和鼠标的商业产品。Ralph Kimball毕业于斯坦福大学电子工程系并获得博士学位。

Margy Ross是Kimball集团总裁。自1982年以来,她主要关注数据仓库和商业智能,强调业务需求和维度建模的重要性。与Ralph Kimball一样,Margy Ross也为许多学生讲授过维度设计最佳实践,她与Ralph Kimball合作,共同撰写了5本工具箱序列书籍。Margy Ross曾工作于Metaphor并与他人共同创立了DecisionWorks咨询公司。她毕业于美国西北大学工业工程系并获得硕士学位。

OLAP部署的注意事项

如果要将数据部署到OLAP多维数据库中,必须注意以下一些问题。

构建于关系数据库之上的星型模式是建立OLAP多维数据库的良好物理基础。通常也被认为是备份与恢复的良好的、稳定的基础。

传统上,一般认为OLAP多维数据库比RDBMS具有更好的性能,但这一优越性随着计算机硬件(例如,设备以及内存数据库)和软件(例如,纵列数据库)的发展变得不那么重要

由于供应商多,OLAP多维数据库数据结构比关系数据库管理系统变化更大,因此,最终的部署细节通常与选择的提供商有关。通常在不同OLAP工具之间建立B1应用比在不同关系数据库之间建立B1更困难。

OLAP多维数据库通常比RDBMS提供更多的复杂安全选项。例如,限制访问细节数据,但对汇总数据往往能够提供更开放的接口。

OLAP多维数据库显然能够提供比RDBMS更加丰富的分析能力,因为后者受SQL的制约。这也可以作为选择OLAP产品的主要依据。

OLAP多维数据库方便地支持缓慢变化维度类型2变化(将在第5章讨论),但当需要使用其他缓慢变化维度技术重写数据时,多维数据库通常需要被全部或部分地重新处理。

OLAP多维数据库方便地支持事务和周期性快照事实表,但是由于前一点所描述的重写数据的限制问题而无法处理累积快照事实表。

OLAP多维数据库通常支持具有层次不确定的复杂的不规则层次结构,例如,组织结构图或物料表等。使用自身查询语法比使用RDBMS的方法更优越OLAP多维数据库与关系数据库比较,能对实现下钻层次的维度关键词结构提供更详细的约束。

一些OLAP产品无法确保实现维度角色和别名,因此需要定义不同的物理维度。

以下将着手考虑星型模式的两个关键部件,以此同到基于关系平台的维度建模世界中。

4步骤维度设计过程

维度模型设计期间主要涉及4个主要的决策:

(1)选择业务过程

(2)声明粒度

(3)确认维度

(4)确认事实

要回答上述问题,需要考虑业务需求以及协作建模阶段涉及的底层数据源。按照业务过程、粒度、维度、事实声明的流程,设计组确定表名和列名、示例领域值以及业务规则。

而业务数据管理代表必须参与详细的设计活动,以确保涵盖正确的业务。

数据仓库工具箱第三版PDF电子版下载截图

数据仓库工具箱第3版豆瓣百度网盘-数据仓库工具箱第三版PDF电子版下载插图(1)数据仓库工具箱第3版豆瓣百度网盘-数据仓库工具箱第三版PDF电子版下载插图(2)数据仓库工具箱第3版豆瓣百度网盘-数据仓库工具箱第三版PDF电子版下载插图(3)数据仓库工具箱第3版豆瓣百度网盘-数据仓库工具箱第三版PDF电子版下载插图(4)

评分及评论

无用户评分

来评个分数吧

  • 5 分
    0
  • 4 分
    0
  • 3 分
    0
  • 2 分
    0
  • 1 分
    0

Comments