2017年数据架构师架构选型必读

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:
这是最好的时代,科学技术推陈出新,各种数据库不再一家独大,关系数据库、非关系数据库(NoSQL)、混合数据库(NewSQL)各领风骚。

 

这也是最坏的时代,琳琅满目的数据库名称和特性,让我们目不暇接。一个个去研究显然时间和精力有限,随大流选一个却又担心走到坑里去,沉没成本太大。

 

刚好这又冬去春来,适合大兴土木大搞建设的时候到了,这里就来跟大家捭阖下。

 

首先还是要有个基准的判断,这个业务系统,是选用关系型数据库呢,还是非关系型数据库?是偏OLTP类型呢还是更加偏OLAP类型?

 

如果是选择传统关系型数据库,通常就只建议在这四个数据库里选择了。

 

20170227101459603.jpg

 

Oracle虽然一直在掉分,而且分数被MySQL拉得很近,但是大家需要注意的是,这个分值并非代表使用的公司的多少,也不代表使用的套数或者数据量的大小,而主要因素是“热度”,这东西跟股市有点差不多,供参考但不能依赖。

 

20170227101504452.jpg

 

DBAplus Newsletter第二期中是这么解读的:“其实这么看上去第一集团还是Oracle / MySQL / SQLServer,PG在快速追赶中,目前离第一集团大概还有3~4倍左右的差距,但PG作为这几个老牌数据库中斜率比较大的,大概在2013年年底有一个跳变,看时间点应该是PG 9.3的发布,随后PG一直保持了非常稳健的向上发展趋势,这个表现非常符合最近几年PostgreSQL社区的快速发展,从9.0到去年的9.6,PG面向传统企业、互联网、金融、物联网、政企等行业发布了诸多特性,在SQL兼容性与时俱进,贴近最新发布的SQL标准,从社区发布的性能测试来看,单机TPS达到了180万的水准。PostgreSQL正在以自己的方式构建一个庞大的生态体系。这个数据也是比较符合直观感受的。”

 

那么,具体要怎么选择呢?如果你是个新鲜的互联网公司,而且也有钱找得起高工资的DBA有能力控制好开发质量,那么不用多说,选择开源数据库吧,MySQL或者PG。如果JSON类LBS业务用得非常多,用PG吧,否则可以用MySQL。

 

选用MySQL,一个重要的新组件暂时还不推荐上:MySQL 5.7.17 Group Replication。从官方的性能测试结果看,性能是优于Galera PXC的,接近异步同步。但是目前在运维方面的支持上不够好,比如备份和集群客户端支持上,离实际生产环境大规模应用还是有一段距离。

 

如果你其实也不知道开发团队会设计出些什么架构,写出些什么代码,对开源数据库的特点也基本没太多经验,那么选Oracle或者SQL Server吧。业务量很大,优选Oracle,否则SQL Server也是可以的。后者几乎是“免维护”的,至少不太请专职DBA。

 

当然,优先推荐的当然是Oracle,因为12cR2已经发布了。浦发银行2017年的新项目全部采用12cR2,当然肯定是要用集群,肯定是要用PDB,肯定是要用IMO,这些技术在吉林移动、浙江移动都在核心生产上跑了好长时间了。是的,R2新出的Sharding还在考量中,虽然看起来很美。

 

MongoDB现在用的也非常多,曾经一度热度超过了PG。目前看起来还是以互联网应用为主,社群今年会有许多线下沙龙,可以多参加了解。

 

国内数据库,我们相信是绝大多数人心中的痛。这个其实也没办法,婴儿学步总要有个时间。

 

Newsletter第二期有5家国产数据库发布了新的产品消息:

 

  • 蚂蚁金服的OceanBase 1.0可申请试用

  • TiDB将发布RC2

  • 达梦发布DM v7.1.5.145 

  • 巨杉数据库发布SequoiaDB 2.6社区版

  • 南大通用发布GBase UP

  • 原文发布时间为:2017-02-25

    本文来自云栖社区合作伙伴DBAplus

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
29天前
|
存储 SQL 关系型数据库
ClickHouse(02)ClickHouse架构设计介绍概述与ClickHouse数据分片设计
ClickHouse的核心架构包括执行过程和数据存储两部分。执行过程涉及Parser与Interpreter解析SQL,通过Column、DataType、Block、Functions和Storage模块处理数据。Column是内存中列的表示,Field处理单个值,DataType负责序列化和反序列化,Block是内存中表的子集,Block Streams处理数据流。Storage代表表,使用不同的引擎如StorageMergeTree。数据存储基于分片和副本,1个分片由多个副本组成,每个节点只能拥有1个分片。
70 0
ClickHouse(02)ClickHouse架构设计介绍概述与ClickHouse数据分片设计
|
30天前
|
敏捷开发 缓存 架构师
Apache 架构师总结的 30 条架构原则
Apache 架构师总结的 30 条架构原则
22 0
|
2月前
|
缓存 安全 API
【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的API网关设计实现
公司对外开放的OpenAPI-Server服务,作为核心内部系统与外部系统之间的重要通讯枢纽,每天处理数百万次的API调用、亿级别的消息推送以及TB/PB级别的数据同步。经过多年流量的持续增长,该服务体系依然稳固可靠,展现出强大的负载能力。
55 9
【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的API网关设计实现
|
17天前
|
机器学习/深度学习 人工智能 架构师
【架构师】AI时代架构师必备技能
【架构师】AI时代架构师必备技能
|
1月前
|
SQL 缓存 分布式计算
日增数据超10PB!揭秘沃尔玛Lakehouse架构选型之路
日增数据超10PB!揭秘沃尔玛Lakehouse架构选型之路
44 2
|
1月前
|
存储 SQL 机器学习/深度学习
通用数据湖仓一体架构正当时
通用数据湖仓一体架构正当时
59 2
|
1月前
|
设计模式 架构师 前端开发
架构师进阶篇-什么是架构师
架构师进阶篇-什么是架构师
52 0
|
2月前
|
存储 消息中间件 Java
【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的高可靠消息服务设计实现
在深入研究了 **“【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的API网关设计实现”** 设计实现后,我们意识到,尽管API网关为服务商提供了高效的数据获取手段,但实时数据的获取仍然是一个亟待解决的问题。
31 1
【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的高可靠消息服务设计实现
|
2月前
|
前端开发 JavaScript API
|
4月前
|
Dubbo 应用服务中间件 Docker
阿里P8架构师谈微服务架构:Dubbo+Docker+SpringBoot+Cloud
什么是微服务架构呢?简单说就是将一个完整的应用(单体应用) 按照一定的拆分规则(后文讲述)拆分成多个不同的服务,每个服务都能独立地进行开发、部署、扩展。服务于服务之间通过注入RESTful api或其他方式调用。