DW – 类型

DW – 类型


有四种类型的数据仓库系统。

  • 数据库
  • 在线分析处理 (OLAP)
  • 在线事务处理 (OLTP)
  • 预测分析 (PA)

数据库

数据集市被称为数据仓库系统的最简单形式,通常由组织中的单个功能区域组成,如销售、财务或营销等。

组织中的数据集市,由单个部门创建和管理。由于它属于单个部门,因此该部门通常仅从少数或一种类型的来源/应用程序中获取数据。该来源可以是内部操作系统、数据仓库或外部系统。

在线分析处理

在 OLAP 系统中,与事务系统相比,事务数量较少。执行的查询本质上是复杂的,并且涉及数据聚合。

什么是聚合?

我们保存包含聚合数据的表格,例如每年(1 行)、每季度(4 行)、每月(12 行)等,如果有人必须进行年度比较,则只会处理一行。但是,在未聚合的表中,它将比较所有行。

SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';

OLAP系统中的有效措施

响应时间被称为OLAP系统中最有效和最关键的度量之一聚合存储的数据在多维模式中维护,如星型模式(当数据被安排到层次结构组中时,通常称为维度,并分为事实和聚合事实,称为模式)。

OLAP 系统的延迟是几个小时,而数据集市的延迟预计接近一天。

在线交易处理

在OLTP系统中,存在大量的INSERT、UPDATE、DELETE等短的在线事务。

在 OLTP 系统中,一个有效的措施是处理短事务的时间非常少。它控制多路访问环境中的数据完整性。对于 OLTP 系统,每秒事务数衡量有效性OLTP 数据仓库系统包含当前和详细的数据,并在实体模型 (3NF) 的模式中进行维护。

例子

零售店中的日常交易系统,每天插入、更新和删除客户记录。它提供了非常快速的查询处理。OLTP 数据库包含详细的当前数据。用于存储OLTP 数据库的Schema 是Entity 模型。

OLTP 和 OLAP 的区别

下图显示了OLTPOLAP系统之间的主要区别

OLTP 和 OLAP

  • 索引– OLTP 系统只有很少的索引,而在 OLAP 系统中有许多用于性能优化的索引。

  • 联接– 在 OLTP 系统中,大量联接和数据被规范化。但是,在 OLAP 系统中,联接较少并且是非规范化的。

  • 聚合– 在 OLTP 系统中,数据未聚合,而在 OLAP 数据库中使用更多聚合。

预测分析

预测分析是通过使用不同的数学函数来预测未来结果,从而发现存储在 DW 系统中的数据中的隐藏模式。

预测分析系统在使用方面不同于 OLAP 系统。它用于关注未来的结果。OALP 系统侧重于分析报告的当前和历史数据处理。

觉得文章有用?

点个广告表达一下你的爱意吧 !😁