PostgreSQL 10.1 手册_部分 II. SQL 语言_第 15章 并行查询_15.1. 并行查询如何工作

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介: 15.1. 并行查询如何工作 当优化器判断对于某一个特定的查询,并行查询是最快的执行策略时,优化器将创建一个查询计划。该计划包括一个Gather或Gather Merge节点。下面是一个简单的例子: EXPLAIN SELECT * FROM pgbench_accounts WHERE fi.

15.1. 并行查询如何工作

当优化器判断对于某一个特定的查询,并行查询是最快的执行策略时,优化器将创建一个查询计划。该计划包括一个GatherGather Merge节点。下面是一个简单的例子:

EXPLAIN SELECT * FROM pgbench_accounts WHERE filler LIKE '%x%';
                                     QUERY PLAN                                      
-------------------------------------------------------------------------------------
 Gather  (cost=1000.00..217018.43 rows=1 width=97)
   Workers Planned: 2
   ->  Parallel Seq Scan on pgbench_accounts  (cost=0.00..216018.33 rows=1 width=97)
         Filter: (filler ~~ '%x%'::text)
(4 rows)

在所有的情形下,GatherGather Merge 节点都只有一个子计划,它是将被并行执行的计划的一部分。如果 Gather 或Gather Merge节点位于计划树的最顶层,那么整个查询将并行执行。 如果它位于计划树的其他位置,那么只有在它下面的计划部分会并行执行。 在上面的例子中,查询只访问了一个表,因此除Gather 节点本身之外只有一个计划节点。因为该计划节点是 Gather 节点的孩子节点,所以它会并行执行。

使用 EXPLAIN命令, 你能看到规划器选择的工作者数量。 当查询执行期间到达Gather节点时, 实现用户会话的进程将会请求和规划器选中的工作者数量一样多的 后台工作者进程。 规划器考虑使用的后台工作者的数量限制为最多 max_parallel_workers_per_gather。 任何时候能够存在的后台工作者进程的总数由max_worker_processes 和max_parallel_workers限制, 因此一个并行查询可能会使用比规划中少的工作者来运行, 甚至有可能根本不使用工作者。最优的计划可能取决于可用的工作者的数量, 因此这可能会导致不好的查询性能。如果这种情况经常发生, 那么就应当考虑一下提高max_worker_processesmax_parallel_workers 的值,这样更多的工作者可以同时运行;或者降低max_parallel_workers_per_gather, 这样规划器会要求少一些的工作者。

为一个给定并行查询成功启动的后台工作者进程都将会执行计划的并行部分。 这些工作者的领导者也将执行该计划,不过它还有一个额外的任务: 它还必须读取所有由工作者产生的元组。当整个计划的并行部分只产生了少量元组时, 领导者通常将表现为一个额外的加速查询执行的工作者。反过来, 当计划的并行部分产生大量的元组时,领导者将几乎全用来读取由工作者产生的元组并且执行 Gather节点或Gather Merge 节点上层计划节点所要求的任何进一步处理。在这些情况下, 领导者所作的执行并行部分的工作将会很少。

当计划平行部分顶部的节点是Gather Merge而不是Gather时, 它表示执行计划的并行部分的每个进程正在按排序顺序生成元组, 领导者正在执行顺序保留合并。相反,Gather 以任何方便地顺序从工作者读取元组,从而破坏可能存在的任何排序顺序。

本文转自PostgreSQL中文社区,原文链接:15.1. 并行查询如何工作

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
2月前
|
关系型数据库 分布式数据库 数据库
PolarDB常见问题之加了索引但是查询没有使用如何解决
PolarDB是阿里云推出的下一代关系型数据库,具有高性能、高可用性和弹性伸缩能力,适用于大规模数据处理场景。本汇总囊括了PolarDB使用中用户可能遭遇的一系列常见问题及解答,旨在为数据库管理员和开发者提供全面的问题指导,确保数据库平稳运行和优化使用体验。
|
4天前
|
SQL 关系型数据库 数据库
SQL 42501: Postgresql查询中的权限不足错误
SQL 42501: Postgresql查询中的权限不足错误
|
5天前
|
SQL 关系型数据库 MySQL
【MySQL】:探秘主流关系型数据库管理系统及SQL语言
【MySQL】:探秘主流关系型数据库管理系统及SQL语言
11 0
|
17天前
|
关系型数据库 分布式数据库 数据库
PolarDB闪电助攻,《香肠派对》百亿好友关系实现毫秒级查询
PolarDB分布式版助力《香肠派对》实现百亿好友关系20万QPS的毫秒级查询。
PolarDB闪电助攻,《香肠派对》百亿好友关系实现毫秒级查询
|
17天前
|
SQL 存储 Oracle
关系型数据库查询数据的语句
本文介绍了关系型数据库中的基本SQL查询语句,包括选择所有或特定列、带条件查询、排序、分组、过滤分组、表连接、限制记录数及子查询。SQL还支持窗口函数、存储过程等高级功能,是高效管理数据库的关键。建议深入学习SQL及相应数据库系统文档。
11 2
|
18天前
|
SQL 安全 关系型数据库
关系型数据库控制语言(DCL)
DCL是SQL的一部分,用于控制数据库安全和访问权限。主要包括GRANT(授权)、REVOKE(撤销)和角色管理。GRANT用于给予用户访问数据库对象的权限,REVOKE用于撤销权限。角色管理则允许批量授予一组权限。DCL帮助管理员精细控制数据访问,确保安全性和完整性。不同RDBMS对DCL的实现可能略有差异,使用时需参考相应文档。
15 6
|
2月前
|
SQL 关系型数据库 分布式数据库
在PolarDB中,如果慢SQL导致了CPU升高,进而又产生了更多的慢SQL
【2月更文挑战第22天】在PolarDB中,如果慢SQL导致了CPU升高,进而又产生了更多的慢SQL
15 1
|
3月前
|
SQL 关系型数据库 分布式数据库
在PolarDB for PostgreSQL中,你可以使用LIKE运算符来实现类似的查询功能,而不是使用IF函数
在PolarDB for PostgreSQL中,你可以使用LIKE运算符来实现类似的查询功能,而不是使用IF函数
43 7
|
3月前
|
存储 关系型数据库 分布式数据库
PolarDB for PostgreSQL查询问题之条件查询失败如何解决
PolarDB for PostgreSQL是基于PostgreSQL开发的一款云原生关系型数据库服务,它提供了高性能、高可用性和弹性扩展的特性;本合集将围绕PolarDB(pg)的部署、管理和优化提供指导,以及常见问题的排查和解决办法。