数据中心建设----仓库设计中的过程模型/数据模型

在数据仓库设计过程中我们有一些可以遵循的设计模型,这里有过程模型数据模型,其中过程模型仅仅适用于操作性环境,数据模型既适用于操作型环境也适用于数据仓库环境。如果使用的地方不当将达不到既定的目标。下图说明它们的应用位置:

过程模型和数据模型适用的位置

过程模型:过程模型是由需求驱动的,它假设在详细设计之前需求是已知的,但因为数据仓库环境面临的需求是未知的,所以它不适用于数据仓库环境。

数据模型:数据模型既适用于操作型环境也适用于数据仓库环境,数据模型建造时没有考虑现有系统和数据仓库之间的区别,它只关注原数据,所以要从企业的数据模型可以导出操作型数据模型数据仓库型数据模型

企业模型导出操作型数据模型和数据仓库型数据模型

数据建模的过程分为:高层建模、中间层建模底层建模

高层建模:也被叫做实体关系图(ERD)下图给出一个ERD的例子:

实体与关系的表示

中间层建模:也被叫做数据集(DIS),对高层建模中的每个主题域和实体都要建立一个中间层模型,但是中间层模型很少能一次性建好,总是在不断的补充和扩展。

ERD中每个实体与其对应的DIS的进一步定义

中间层模型主要有四个基本的组成部分:

  • 主要数据分组:每个主题域有且只有一个主要数据分组,包含了每个主题域中只存在一次的属性。
  • 二级数据分组:包含了每个主题域中存在多次的属性。
  • 连接器:表示连个主题域之间的关系。
  • 数据的类型:数据的类型是由指向数据分组右边的线段指示。左边的数据分组是超类型,右边的数据分组是数据的子类型。(不明白)
中间层数据模型的四个组成部分

底层建模:又叫物理数据模型,是从中间层模型而来,是模型中包含关键字和物理特性,这是物理模型看上去就是一些表,这些表叫做关系表。但是不能直接将这些表用于物理数据库设计,还要对其做性能特性的优化。

~本文为《Building the Data Warehouse, 4th Edition 》第三章第一次读书笔记

推荐阅读更多精彩内容