数据库选型思索 - 致 架构师、开发者

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

标签

PostgreSQL , 数据库选型


背景

数据库选型是一件很大的事情,也是一件很头疼的事情。

很多企业并没有数据库的选型标准,或者并不了解业务需要什么样的数据库。

很多企业的数据库是开发说了算,熟悉什么就用什么,很多选型失误,导致后期非常尴尬的局面。

那么数据库选型要注意什么呢?

列举一些例子,取自如下文档

《数据库选型的关键指标》

选型维度

功能差异

1. 递归查询, connect by, 树形查询

PostgreSQL 通过(with 或 tablefunc支持)支持例子

https://yq.aliyun.com/articles/240

http://www.postgresql.org/docs/9.5/static/tablefunc.html

2. 窗口查询, window over

PostgreSQL 支持例子

http://blog.163.com/digoal@126/blog/static/16387704020137154137930

http://blog.163.com/digoal@126/blog/static/16387704020121024102312302/

http://blog.163.com/digoal@126/blog/static/16387704020124239390354/

http://www.postgresql.org/docs/9.5/static/functions-window.html

3. rollup, grouping sets, cube

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/queries-table-expressions.html#QUERIES-GROUPING-SETS

http://blog.163.com/digoal@126/blog/static/16387704020154269591874/

4. 高级聚合(json,数组,相关性,标准差(采样,全局),截距,斜率,方差(采样,全局),mode,percentile_cont,distc,rank,dense_rank,percent_rank,cume_dist,grouping)

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/functions-aggregate.html

http://blog.163.com/digoal@126/blog/static/1638770402015224124337/

http://blog.163.com/digoal@126/blog/static/1638770402015379286873/

http://blog.163.com/digoal@126/blog/static/16387704020153713222764

4. hash join, merge join, nestloop join

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/xoper-optimization.html

http://www.postgresql.org/docs/9.5/static/planner-optimizer.html

5. 哈希聚合

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/runtime-config-query.html#RUNTIME-CONFIG-QUERY-ENABLE

6. 事务间共享事务快照

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/functions-admin.html#FUNCTIONS-SNAPSHOT-SYNCHRONIZATION

http://www.postgresql.org/docs/9.5/static/sql-set-transaction.html

http://www.postgresql.org/docs/9.5/static/app-pgdump.html

http://blog.163.com/digoal@126/blog/static/163877040201326829943/

http://blog.163.com/digoal@126/blog/static/163877040201241134721101/

7. 展开式索引(支持多列任意组合查询)

PostgreSQL 支持例子

《宝剑赠英雄 - 任意组合字段等效查询, 探探PostgreSQL多列展开式B树》

约束

1. foreign key

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/ddl-constraints.html

2. for no key update, for key share 粒度锁

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/explicit-locking.html#LOCKING-ROWS

http://blog.163.com/digoal@126/blog/static/16387704020130249109133/

http://blog.163.com/digoal@126/blog/static/16387704020130305109687/

3. check 约束

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/ddl-constraints.html

4. exclusion 约束

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/ddl-constraints.html

易用性

1. 表空间

2. alter 列值转表达式

(alter table alter column c1 type newtype using (expression(...)) )

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/sql-altertable.html

https://yq.aliyun.com/articles/30470

3. alter table 需要重组表的操作

PostgreSQL少量操作需要重组

vacuum full, cluster, 修改字段数据类型, (修改长度不需要重组表)

http://www.postgresql.org/docs/9.5/static/sql-altertable.html

4. 分区表

《PostgreSQL 9.5+ 高效分区表实现 - pg_pathman》

《PostgreSQL 10.0 内置分区表》

5. 物化视图

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/sql-creatematerializedview.html

6. 物化视图增量刷新

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/sql-refreshmaterializedview.html

7. 表继承关系

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/tutorial-inheritance.html

8. 使用 like 建结构类似的表

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/sql-createtable.html

开发功能

1. 客户端开发语言支持

C, java, python, ...

2. 函数

返回 void, 单行,SRF,事件触发器(MySQL 不支持),触发器

例子

http://blog.163.com/digoal@126/blog/static/16387704020132131361949/

http://www.postgresql.org/docs/9.5/static/event-triggers.html

3. 2PC

4. 服务端绑定变量

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/sql-prepare.html

5. savepoint

6. 异步消息

PostgreSQL 支持例子

http://www.postgresql.org/docs/9.5/static/sql-notify.html

http://www.postgresql.org/docs/9.5/static/sql-listen.html

7. 游标

数组FOR循环,query FOR循环,游标FOR循环

PostgreSQL 全面支持例子

http://www.postgresql.org/docs/9.5/static/plpgsql-control-structures.html

http://www.postgresql.org/docs/9.5/static/plpgsql-cursors.html

(MySQL 暂不支持数组)

类型

1. 数据类型

1.1 PostgreSQL

高精度numeric, 浮点, 自增序列,货币,字节流,时间,日期,时间戳,布尔,枚举,平面几何,立体几何,多维几何,地球,PostGIS,网络,比特流,全文检索,UUID,XML,JSON,数组,复合类型,域类型,范围,树类型,化学类型,基因序列,FDW, 大对象, 图像

1.2 MySQL

数字,时间,字符串,简单的GIS,JSON

2. 支持索引的数据类型

2.1 PostgreSQL

高精度numeric, 浮点, 自增序列,货币,字节流,时间,日期,时间戳,布尔,枚举,平面几何,立体几何,多维几何,地球,PostGIS,网络,比特流,全文检索,UUID,XML,JSON,数组,复合类型,域类型,范围,树类型,化学,基因序列

2.2 MySQL

数字,字符串,比特流,时间,全文检索,GIS

索引支持

1. 索引方法

PostgreSQL 支持 btree, hash, gist, sp-gist, gin, brin , bloom , rum 索引

MySQL 支持 btree, gis类型索引

2. 规则表达式、前后模糊查询,支持索引检索

PostgreSQL 支持

3. 数组支持索引

PostgreSQL 支持

4. 全文检索支持索引

5. 索引扩展功能

5.1 PostgreSQL 支持 表达式索引,部分索引,联合索引

5.2 PostgreSQL 支持图像相似度、文本相似度搜索

5.3 自定义索引访问方法(bloom, rum, ......)

PostgreSQL支持

多引擎和外部源支持

1. 多引擎支持

1.1 PostgreSQL

内置heap, 通过插件实现内存表, 列存储, 压缩存储, 流式存储, 非关系存储等。

1.2 MySQL

MyISAM, innodb, ...

2. 外部表

PostgreSQL支持任意外部数据源, (例如jdbc, file, odbc, oracle, mysql, db2, redis, mongo, ES, hadoop......)

https://wiki.postgresql.org/wiki/Fdw

3. dblink

PostgreSQL 支持

4. 内存表

PostgreSQL 通过外部表支持,或者通过插件支持

5. ES(弹性搜索引擎) 引擎

PostgreSQL 支持

安全

1. 数据加密

PostgreSQL 支持加密数据类型,可选GPG加密算法

2. 认证方法

PostgreSQL 支持 密码、LDAP、AD、GSSAPI、SSPI、Ident、Peer、RADIUS、PAM、签名认证

3. 数据传输加密

PostgreSQL 支持

4. 行安全策略

PostgreSQL 支持

5. 数据库内部支持libselinux接口, (美国国家安全局制定的安全加强标准)

PostgreSQL 支持

优化器

http://www.postgresql.org/docs/9.5/static/runtime-config-query.html

1. GPU 并行计算支持

PostgreSQL 支持

2. 遗传优化器算法

PostgreSQL 支持CBO、CRO、遗传算法

3. HINT PLAN

4. CPU 并行计算

PostgreSQL 支持 (线性性能提升)

5. 自定义成本因子

PostgreSQL 支持

编程扩展

1. 是否支持采样查询

PostgreSQL 支持

2. 是否支持扩展采样算法

PostgreSQL 支持

3. 自定义数据类型

PostgreSQL 支持

4. 自定义索引方法

PostgreSQL 支持

5. 字符集自动转换, C扩展接口

PostgreSQL 支持

6. 自定义聚合

PostgreSQL 支持

7. 自定义窗口

PostgreSQL 支持

扩展能力

1. 类型扩展,操作符扩展,函数扩展,索引方法扩展,索引扩展,

PostgreSQL 支持

2. C触发器函数, C事件触发器函数

PostgreSQL 支持

3. 函数语言扩展

PostgreSQL 支持扩展函数支持接口, erlang, ....

4. 机器学习库

PostgreSQL 支持

5. 流式计算

PostgreSQL 支持

性能

《数据库界的华山论剑 tpc.org》

《facebook linkbench 测试PostgreSQL社交关系图谱场景性能》

《PostgreSQL 主机性能测试方法 - 单机多实例》

《PostgreSQL 主机性能测试方法 - 单机单实例》

《PostgreSQL 源码性能诊断(perf profiling)指南》

《"物联网"流式处理应用 - 用PostgreSQL实时处理(万亿每天)》

《PostgreSQL 百亿地理位置数据 近邻查询性能》

《PostgreSQL 百亿数据 秒级响应 正则及模糊查询》

《PostgreSQL 1000亿数据量 正则匹配 速度与激情》

《恭迎万亿级营销(圈人)潇洒的迈入毫秒时代 - 万亿user_tags级实时推荐系统数据库设计》

《从难缠的模糊查询聊开 - PostgreSQL独门绝招之一 GIN , GiST , SP-GiST , RUM 索引原理与技术背景》

《分析加速引擎黑科技 - LLVM、列存、多核并行、算子复用 大联姻 - 一起来开启PostgreSQL的百宝箱》

服务端编程语言

1. 函数(过程)语言

PostgreSQL支持几乎所有的地球编程语言,你可以用他们在数据库中编写UDF

plpgsql, sql, c, c++, java, javascript, R, python, perl, php, tcl, ruby, lua, ...

scale out

1. PostgreSQL完全支持以下下推功能

支持聚合算子下推

支持WHERE条件下推

支持JOIN下推

支持SORT下推

支持SELECT 子句下推

支持跨数据源JOIN

scale up能力

PostgreSQL

资源管控能力强。

单实例可以充分发挥HPC的性能,有多少资源就能使用多少资源。

可用性、可靠性

PostgreSQL

PIRT,任意时间点恢复;FPW;

物理、逻辑级流式复制;金融级多副本;

技术储备

社区、生态

社区状态

PostgreSQL

单一开源分支,社区力量较集中。全球有1000名以上的内核研发人员。

社区研发由核心组员和committer组成,持续5年以上对社区版本有贡献内核研发人员超过50位。

社区核心人员分别来自数据库厂商,数据库支持和服务公司,数据库最终用户的公司,形成了一个非常好的力量均衡。

社区活跃度

PostgreSQL

非常活跃(see git.postgresql.org, github.com/postgres)

学习成本

维护成本

平台兼容性

代码成熟度

应用场景、案例

开源许可

全球发展前景

详细文档参考

《数据库选型的关键指标》

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
21天前
|
Cloud Native OLAP OLTP
在业务处理分析一体化的背景下,开发者如何平衡OLTP和OLAP数据库的技术需求与选型?
在业务处理分析一体化的背景下,开发者如何平衡OLTP和OLAP数据库的技术需求与选型?
122 4
|
25天前
|
关系型数据库 分布式数据库 数据库
数据库流行度排行榜会影响你的数据库选型吗
【2月更文挑战第33天】数据库流行度排行榜会影响你的数据库选型吗
16 2
|
1月前
|
SQL NoSQL 前端开发
基于BS架构的饰品购物平台设计与实现(程序+文档+数据库)
基于BS架构的饰品购物平台设计与实现(程序+文档+数据库)
|
2月前
|
关系型数据库 分布式数据库 数据库
阿里云PolarDB登顶2024中国数据库流行榜:技术实力与开发者影响力
近日,阿里云旗下的自研云原生数据库PolarDB在2024年中国数据库流行度排行榜中夺冠,并刷新了榜单总分纪录,这一成就引起了技术圈的广泛关注。这一成就源于PolarDB在数据库技术上的突破与创新,以及对开发者和用户的实际需求的深入了解体会。那么本文就来分享一下关于数据库流行度排行榜的影响力以及对数据库选型的影响,讨论PolarDB登顶的关键因素,以及PolarDB“三层分离”新版本对开发者使用数据库的影响。
74 3
阿里云PolarDB登顶2024中国数据库流行榜:技术实力与开发者影响力
|
2月前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
2月前
|
关系型数据库 分布式数据库 数据库
阿里云瑶池数据库训练营权益:PolarDB开发者大会主题资料开放下载!
阿里云瑶池数据库训练营权益:PolarDB开发者大会主题资料开放下载!
|
3月前
|
存储 缓存 关系型数据库
鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级
阿里云RDS率先推出新型存储类型通用云盘,提供低延迟、低成本、高持久性的用户体验。
鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级
|
3月前
|
存储 NoSQL 数据库
知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)
知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)
知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)
|
3月前
|
人工智能 Serverless 数据库
在云时代下,开发者需要什么样的数据库?
近两年技术圈的蓬勃发展,大家有目共睹,尤其是在云计算、大数据和人工智能等技术的快速发展下,数据库技术也正经历和面临着一次划时代的转变。大家都知道,随着Serverless架构的崛起和人工智能的应用,数据库开发者需要面对的需求和挑战也日益增多,实际开发中的问题也是层出不穷、日新月异。作为开发者,尤其是在日常开发中结合云原生,需要使用什么样的数据库才算符合我们的开发需求呢?那么本文就来简单讨论一下在云时代下,开发者需要什么样的数据库,讨论DBA(数据库管理员)的工作是否会被人工智能取代,以及探寻当前最需要的数据库类型。通过深入了解这些话题,我们可以更好地应对数据库技术的发展和变革。
45 1
在云时代下,开发者需要什么样的数据库?
|
3月前
|
分布式数据库 数据库 数据安全/隐私保护
开发者关注的数据库技术与创新,未来数据库的演进及理想数据库的构想
作为开发者,想必大家都知道在技术圈中数据库相关领域是技术开发中的重中之重,数据库技术与创新不断推动着数字化时代的发展,数据库技术正在经历着一次创新的浪潮,还有就是数据库技术的不断创新为开发者们在日常实际开发中提供了更多的可能性和好的机遇。那么本文就来简单聊聊最值得开发者关注的数据库技术与创新,包括分布式数据库、图数据库、时序数据库、区块链数据库以及AI与数据库的结合等方面,以及探讨未来数据库的演进趋势,并讨论一下在开发者心目中最理想的数据库的特征与构想。
53 3