数据仓库-读书笔记一

DW/Bi系统业务有哪些需求(要求)

  1. 方便的存取数据
  2. 必须以一致的形式展现信息
  3. 能够适应变化
  4. 及时展现信息
  5. 数据安全
  6. 成为提高决策制定能力的权威和可信的基础
  7. 业务群体接受DW/BI系统

DW/Bi系统人员有哪些需求(要求)

  1. 技能要求
  2. 具有较好的信息技术基础并且了解业务
  3. 既需要了解数据库管理的技能,也包括商业分析师的
  4. 技能。
  5. 职责描述
  6. 理解用户
  7. 发布高质量、相关的、可访问的信息和分析
  8. 维护DW/BI环境

维度建模简介

1. 作用

以商业用户可理解的方式发布数据

提供高效的查询性能

注意:维度模型包含的信息与规范化模型包含的信息相同,但将数据以一种用户可以理解的满足查询性能要求的,灵活多变的方式进行了包装。

2. 星型模式与OLAP多维数据库

星型模型

星型模型举例

OLAP采用预计算、索引策略、其它优化方法,多维数据可实现高性能查询。

OLAP提供良好的分析性能,方便上钻和下钻操作

OLAP提供大量的健壮的分析函数

通常是推荐将详细的,原子的信息加载到星型模式中,然后将OLAP多维数据库移植到星型模式上。

OLAP部署的注意事项

1,构建于关系数据库之上的星型模式是建立OLAP多维数据库的良好物理基础。也是备份和恢复的良好的、稳定的基础

2,OLAP对比RDBMS的性能优势,这一优势随着计算机硬件和软件的发展变得没那么重要

3,在不同的OLAP工具之间建立BI应用比在不同关系数据库之间建立BI更困难。

4,OLAP多维数据通常比RDBMS提供更多的复杂安全选项。例如限制访问细节数据

5,OLAP提供比RDBMS更加丰富的分析能力

6,OLAP方便支持缓慢变化维度类型2变化。但是当需要使用其它缓慢变化维度技术重写数据时,多维数据库通常需要被全部或者部分的重新处理

7,OLAP方便支持事务和周期性快照事实表,由于重写数据的限制而无法处理累计快照事实表

8,OLAP支持具有层次不确定的复杂不规则层次结构。例如:组织结构图或物料表

9,OLAP相对于关系数据库,能实现对下钻层次的维度关键词结构提供更加详细的约束

10,一些OLAP产品无法确保实现维度角色和别名,因此需要定义不同的物理维度

3. 用于度量的事实表

事实定义:表示某个业务度量

存储什么内容:组织机构业务过程事件的性能度量结果。

存储原则:将来源于同一个业务过程的底层度量结果存储于一个维度模型中。

为什么这么存储:因为数据量巨大。

事实有哪些类型:可加,半可加,不可加

事实表的粒度的类型:事务,周期性,累计快照

注意事项:

1,允许多个组织的业务用户访问同一个单一的集中式数据仓库,确保他们能在整个企业中使用一致的数据。

2,物理世界的每个度量事件对应的事实表行具有一对一的关系。每行的数据是一个特定级别的细节(粒度)数据

3,同一个事实表的度量行比具有相同的粒度

4. 用于描述环境的维度表

存储的内容:包含于业务过程度量事件有关的文本环境

维度表的语意:“谁(who),什么(what),哪里(where),何时(when),为什么(why),如何(how)”

维度表的特点:通常有多列(多个属性),和事实表比较 维度表通常小的多,单一主键

作用:是用于和事实表连接操作时实现参照完整性的基础,可作为查询约束、分组、报表标识。

注意:

1,尽量减少在维度表中使用代码,将代码替换为详细的文本属性。尽量减少他们对代码转换注释的依赖。

2,为维度属性提供详细的业务术语耗费的精力越多,效果越好,强大的维度属性带来的回报是健壮的分片-分块能力。

3,连续值数字基本上可以认为属于事实,来自于不太大列表的离散数字基本可以认为是维度属性

4,维度表可以冗余,不一定要满足第三范式,通常是非规范化的。对于维度表的存储空间的权衡 往往 关注 简单性和可访问性;是否方便使用,是否能提高查询性能。

5. 星型模式中维度与事实的连接

维度与事实连接


参考资料

数据仓库工具箱

举报
评论 0