PostgreSQL 11 preview - 并行计算增强汇总-阿里云开发者社区

PostgreSQL 11 preview - 并行计算增强汇总

2018-07-28 1569

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生数据库 PolarDB MySQL 版，Serverless 5000PCU 100GB

云原生数据库 PolarDB 分布式版，标准版 2核8GB

云数据库 RDS MySQL Serverless，0.5-2RCU 50GB

简介：

背景

PostgreSQL 11 并行计算能力的增强。

E.1.3.1.2. Parallel Queries

Allow btree indexes to be built in parallel (Peter Geoghegan, Rushabh Lathia, Heikki Linnakangas)

支持并行排序，支持并行创建索引(并行写索引文件)。

《PostgreSQL 11 preview - 并行排序、并行索引 (性能线性暴增) 单实例100亿TOP-K仅40秒》
Allow hash joins to be performed in parallel using a shared hash table (Thomas Munro)

HASH JOIN支持共享哈希表了。原来是每个parallel worker进程一份哈希表副本。
Allow UNION to run each SELECT in parallel if the individual SELECTs cannot be parallelized (Amit Khandekar, Robert Haas, Amul Sul)

当各个UNION ALL内的子句无法支持并行时，PostgreSQL 11会选择union的各个子句并行。

https://git.postgresql.org/gitweb/?p=postgresql.git;a=commit;h=0927d2f46ddd4cf7d6bf2cc84b3be923e0aedc52
```
query1 union query2 union query3;  

当query1,query2,query3 这些QUERY本身无法并行执行时。  

PostgreSQL 11, 选择让 query1,query2,query3 同时执行。  

老版本, 无法并行。  
```
《PostgreSQL 11 preview - Parallel Append(包括 union all\分区查询) (多表并行计算) sharding架构并行计算核心功能之一》
Allow partition scans to more efficiently use parallel workers (Amit Khandekar, Robert Haas, Amul Sul)

同上，支持paralle append扫描多个子分区。
Allow LIMIT to be passed to parallel workers (Robert Haas, Tom Lane)

This allows workers to reduce returned results and use targeted index scans.

允许LIMIT子句下层到各个paralle worker进程。加速带LIMIT的并行查询。
Allow single-evaluation queries, e.g. WHERE clause aggregate queries, and functions in the target list to be parallelized (Amit Kapila, Robert Haas)

允许"单次评估的QUERY"并行执行，例如"where子句中的聚合子句"，"select目标中的函数"。
Add server option parallel_leader_participation to control if the leader executes subplans (Thomas Munro)

The default is enabled, meaning the leader will execute subplans.

Allows the leader process to execute the query plan under Gather and Gather Merge nodes instead of waiting for worker processes. The default is on. Setting this value to off reduces the likelihood that workers will become blocked because the leader is not reading tuples fast enough, but requires the leader process to wait for worker processes to start up before the first tuples can be produced. The degree to which the leader can help or hinder performance depends on the plan type, number of workers and query duration.

允许parallel leader 进程在gather或gather merge节点主动接收worker进程产生的数据，而不是等待。
Allow parallelization of commands CREATE TABLE .. AS, SELECT INTO, and CREATE MATERIALIZED VIEW (Haribabu Kommi)

允许CREATE TABLE .. AS, SELECT INTO, and CREATE MATERIALIZED VIEW这几类SQL并行执行。
Improve performance of sequential scans with many parallel workers (David Rowley)

并行全表扫描性能增强。
Add reporting of parallel worker sort activity to EXPLAIN (Robert Haas, Tom Lane)

explain增加输出详情，包括parallel worker节点排序的统计信息。

相关实践学习

使用PolarDB和ECS搭建门户网站

本场景主要介绍基于PolarDB和ECS实现搭建门户网站。

阿里云数据库产品家族及特性

阿里云智能数据库产品团队一直致力于不断健全产品体系，提升产品性能，打磨产品功能，从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手，打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系，结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台，为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案，提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。

PostgreSQL 11 preview - 并行计算增强汇总

标签

背景

E.1.3.1.2. Parallel Queries

关系型数据库

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像

PostgreSQL 11 preview - 并行计算 增强 汇总

标签

背景

E.1.3.1.2. Parallel Queries

关系型数据库

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像

PostgreSQL 11 preview - 并行计算增强汇总