Apache Presto – 架构

Apache Presto – 架构


Presto 的架构几乎类似于经典的 MPP(大规模并行处理)DBMS 架构。下图说明了 Presto 的架构。

Presto 架构

上图由不同的组件组成。下表详细描述了每个组件。

S.No 组件和描述
1.

Client

客户端 (Presto CLI) 将 SQL 语句提交给协调器以获取结果。

2.

Coordinator

Coordinator 是一个主守护进程。协调器首先解析 SQL 查询,然后分析和计划查询执行。调度程序执行管道执行,将工作分配给最近的节点并监控进度。

3.

Connector

存储插件称为连接器。Hive、HBase、MySQL、Cassandra 等等都充当连接器;否则你也可以实现一个自定义的。连接器为查询提供元数据和数据。协调器使用连接器获取用于构建查询计划的元数据。

4.

Worker

协调器将任务分配给工作节点。工作人员从连接器获取实际数据。最后,工作节点将结果传递给客户端。

Presto – 工作流程

Presto 是一个运行在节点集群上的分布式系统。Presto 的分布式查询引擎针对交互式分析进行了优化,并支持标准 ANSI SQL,包括复杂查询、聚合、连接和窗口函数。Presto 架构简单且可扩展。Presto 客户端 (CLI) 将 SQL 语句提交给主守护进程协调器。

调度器通过执行管道连接。调度程序将工作分配给最接近数据的节点并监控进度。协调器将任务分配给多个工作节点,最后工作节点将结果返回给客户端。客户端从输出过程中提取数据。可扩展性是关键设计。可插拔连接器,如 Hive、HBase、MySQL 等,为查询提供元数据和数据。Presto 采用“简单存储抽象”设计,可以轻松提供针对这些不同类型数据源的 SQL 查询功能。

执行模型

Presto 支持带有旨在支持 SQL 语义的运算符的自定义查询和执行引擎。除了改进调度之外,所有处理都在内存中,并通过网络在不同阶段之间进行流水线处理。这避免了不必要的 I/O 延迟开销。

觉得文章有用?

点个广告表达一下你的爱意吧 !😁