DW – 类型
DW – 类型
有四种类型的数据仓库系统。
- 数据库
- 在线分析处理 (OLAP)
- 在线事务处理 (OLTP)
- 预测分析 (PA)
数据库
数据集市被称为数据仓库系统的最简单形式,通常由组织中的单个功能区域组成,如销售、财务或营销等。
组织中的数据集市,由单个部门创建和管理。由于它属于单个部门,因此该部门通常仅从少数或一种类型的来源/应用程序中获取数据。该来源可以是内部操作系统、数据仓库或外部系统。
在线分析处理
在 OLAP 系统中,与事务系统相比,事务数量较少。执行的查询本质上是复杂的,并且涉及数据聚合。
什么是聚合?
我们保存包含聚合数据的表格,例如每年(1 行)、每季度(4 行)、每月(12 行)等,如果有人必须进行年度比较,则只会处理一行。但是,在未聚合的表中,它将比较所有行。
SELECT SUM(salary) FROM employee WHERE title = 'Programmer';
OLAP系统中的有效措施
响应时间被称为OLAP系统中最有效和最关键的度量之一。聚合存储的数据在多维模式中维护,如星型模式(当数据被安排到层次结构组中时,通常称为维度,并分为事实和聚合事实,称为模式)。
OLAP 系统的延迟是几个小时,而数据集市的延迟预计接近一天。
在线交易处理
在OLTP系统中,存在大量的INSERT、UPDATE、DELETE等短的在线事务。
在 OLTP 系统中,一个有效的措施是处理短事务的时间非常少。它控制多路访问环境中的数据完整性。对于 OLTP 系统,每秒事务数衡量有效性。OLTP 数据仓库系统包含当前和详细的数据,并在实体模型 (3NF) 的模式中进行维护。
例子
零售店中的日常交易系统,每天插入、更新和删除客户记录。它提供了非常快速的查询处理。OLTP 数据库包含详细的当前数据。用于存储OLTP 数据库的Schema 是Entity 模型。
OLTP 和 OLAP 的区别
下图显示了OLTP和OLAP系统之间的主要区别。
-
索引– OLTP 系统只有很少的索引,而在 OLAP 系统中有许多用于性能优化的索引。
-
联接– 在 OLTP 系统中,大量联接和数据被规范化。但是,在 OLAP 系统中,联接较少并且是非规范化的。
-
聚合– 在 OLTP 系统中,数据未聚合,而在 OLAP 数据库中使用更多聚合。
预测分析
预测分析是通过使用不同的数学函数来预测未来结果,从而发现存储在 DW 系统中的数据中的隐藏模式。
预测分析系统在使用方面不同于 OLAP 系统。它用于关注未来的结果。OALP 系统侧重于分析报告的当前和历史数据处理。