云原生数据库如何打造业务弹性

2018-10-18 3305

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生数据库 PolarDB 分布式版，标准版 2核8GB

RDS SQL Server Serverless，2-4RCU 50GB 3个月

云数据库 RDS SQL Server，基础系列 2核4GB

简介： 云计算带来了业务弹性上的极大优势，阿里云数据库高级产品专家时慢从应用架构的变迁，客户实战案例，业务分析等方面详细介绍POLARDB，及如何利用POLARDB设计互联网创新型应用的数据库架构。

云计算带来了业务弹性上的极大优势，阿里云数据库高级产品专家时慢从应用架构的变迁，客户实战案例，业务分析等方面详细介绍POLARDB，及如何利用POLARDB设计互联网创新型应用的数据库架构。

应用架构的变迁——为什么我们需要超级MySQL？

POLARDB跟MySQL是100%兼容的，有超越MySQL很多倍的性能，以及单实例最大100TB的超大存储空间，可以理解为阿里自研的超级MySQL。那么我们为什么要打造这样一款超级MySQL呢？我们理解这是应用架构进行互联网分布式变迁的必然结果。首先我们需要回顾一下应用架构的变迁的历史，从最早的CS架构到BS架构，从J2EE到Spring/Struts/Hibernate，再到现在的微服务架构，经历了很多代的架构转型。从传统应用的业务架构到互联网分布式的应用架构，在方方面面都发生了变化。从资源层，到数据层，中间件，应用的发布封装以及应用的框架，开发运维的角度都在发生了互联网分布式变迁。

资源层：传统应用会使用X86 ，小机以及存储设备；互联网分布式应用在使用公有云，私有云，混合云等。
数据层：传统应用会使用Oracle，DB2等集中化的商业数据库，互联网应用使用的是MySQL，Redis，HBase这样的分布式数据库，他们不需要集中化的存储设备。
中间件：传统应用会使用WebLogic，WebSphere等，互联网应用在向微服务架构转型中通常会使用Swarm，K8S，Mesos。
应用发布封装：传统应用会使用JAVA开发并发布成war/ear文件封装，再发布到中间件。微服务架构通常会将应用发布成容器的镜像。
应用框架：传统应用通常会使用Spring，Struts，hibernate来开发，而目前互联网分布式应用更多使用的是SpringCloud, Double, EDAS等微服务架构。
开发运维：传统应用会使用可控的发布，保守的运维，新功能上线需要数周，甚至数月时间；互联网分布式架构更多使用的是DevOps持续集成，敏捷快速迭代。

我们理解，互联网分布式应用发生这些架构的改变，目标都是使业务更加敏捷，更加具有弹性，能承载来自互联网的高并发压力。在创新架构下，业务应用可以通过微服务的方式随时进行横向扩展，但压力并不会被处理掉，负载会直接透传到数据层面，解决了应用弹性的问题，反而对数据库产生了更大的挑战。互联网的分布式架构要求数据库更加敏捷，拥有更好的弹性以及更低的成本。（传统应用中，一个应用可能只需要一个数据库作承载，但在互联网分布式应用下，进行了微服务改造之后，一个业务系统可能就需要数十个甚至上百个数据库去承载，因此对成本也提出了要求。）

实战——阿里云数据库为业务架构变迁做好准备

目前，阿里云的数据库形态已经覆盖了互联网中99%的业务场景。关系型数据库包括有MySQL，SQL Server，PG，POLARDB。NoSQL产品家族包括Redis，MongoDB，HBase等。同时具备混合分析型的数据仓库，分布式数据库DRDS，以及数据库服务于工具（DTS，DBS，CloudDBA，DMS等）。
ApsaraDB

演进路线

阿里云上提供了这么多的数据库产品，在实际应用中该如何进行选择呢？我们已经为业务的快速发展和更新迭代做好了准备。这是我们建议的应用架构的演进路线：在业务的初期，建议选择MySQL来快速构建业务应用。当成长起来之后，独立MySQL无法承载更大业务压力的时候，可以基于MySQL做读写分离，不需要对应用做任何改造。我们进入快速成长期，读写分离也无法承载业务需求时，可以无缝迁移到POLARDB，迁移中不需要对业务系统做任何的更改，而且POLARDB的读写分离通过共享存储消除了复制延迟，更适合对数据一致性有更高要求的场景。当业务进一步发展壮大期间，还可以在POLARDB上做垂直拆分。垂直拆分是指将业务模块垂直拆分到不同数据库实例，分到多个独立数据库中去，比如分成用户库，订单库，仓储库等，从而用更多的独立数据库联合来应对业务负载的压力。当业务发展到象淘宝这么大的规模和体量，就需要采用DRDS进行分布式改造、跨机房多活，以及根据业务拆分做单元化改造，这正是阿里淘系应用已经走过并行之有效的演进道路。

应用链路的优化——自动读写分离，短连接优化

我们使用数据库代理来进行链路访问层的优化。访问数据库的标准模式是直接访问主实例和只读实例。在这种模式下需要在业务层面做读写分离的逻辑拆分。我们提供了代理模式，让业务层和数据库层完全解耦。在访问数据库时，不需要直接连接数据库实例，而是连接对业务完全透明的Proxy，它接收到SQL请求后会自动化做读写分离，把所有写操作路由到主实例，并把读操作负载均衡的路由到只读实例上，从而实现对业务透明的自动化读写分离。代理模式除了实现读写分离外，还可以进行故障数据库的透明切换。不论是标准模式还是代理模式，当主实例发生故障后，都可以自动切换到备份的实例上，保证数据库的可用性。但在标准模式中，切换后业务需要进行数据库重连，但通过Proxy，业务应用不需要重连，感受不到高可用切换。同时，代理模式还提供了短连接优化。举例来说，如果业务是使用PHP开发，它连接数据库就是采用短链接的方式，在访问数据库时每次连接都会产生connection，使得数据库在处理连接池上不堪重负。Proxy可以将短链接转化成长链接，并自主维护连接池。同时，代理模式还提供了防暴力破解的功能。比如Proxy可以检测到某个IP不停的尝试重输密码，并主动进行屏蔽。

实时分析数据仓库——POLARMPP，POLARDB最佳搭档

数据的处理可以分成数据库生态和大数据生态。数据库生态适合于处理交易订单等数据一致性要求强的场景，但在处理能力和处理量级上不会特别大。比如订单量在1TB、2TB级别时，还可以使用，但数量一旦增长到3TB~5TB时，单库的性能就会出现非常大的瓶颈，此时复杂的分析查询就会使得数据库不堪重负。通常的做法是采用大数据生态，通过ETL或数据复制的方式把在线事务处理产生的数据复制到Hadoop生态中进行数据实时分析。在Hadoop 生态中，标准方式是利用MapReduce或Spark来做数据分析，但开发人员并不习惯MR或Spark，也不喜欢使用Scala语言，他们还是习惯于使用SQL。所以在这种模式下，经常还要给开发人员准备Hive、Impla等类SQL组件，让研发人员仍然可以使用SQL来处理数据。这种方式存在的问题，在于在线事务处理和离线数据仓库之间有延迟，少则几秒，多则几分钟甚至几小时。并且数据实际上存了两份，并不经济。

针对这种情况，我们提供了POLAR MPP和HybridDB来解决，它可以很好的处理数据的写入，提供百万级的TPS，非常适合用于存储用户的行为、标签、Log日志等。这种模式可以对百亿级的大表做出毫秒级的响应，对多表关联做复杂的聚合，做多值的子列，全文检索。最重要的是，它可以和POLARDB共用一份数据，极大的缓解了数据库生态和大数据生态中需要存储两份数据，并且读写存在延迟的问题。

业务场景分析——互联网创新型应用场景实践

有了云原生数据库作为武器，互联网创新型的业务场景应该如何设计呢？在讲到创新型业务前，先看一下传统的采用MySQL一主N从的架构，如何构建数据仓库驱动BI报表实现商务智能。这种架构的问题是需要存储N份数据，做数据的同步复制。MySQL 的主从之间要进行数据复制，从业务库到分析库也要进行数据复制。

那么采用云原生POLARDB的系统架构应该如何设计呢？这之间，POLARDB和只读分析库构成了云原生的数据集群，由POLAR Store统一进行数据的共享存储。业务应用会把在线的业务写到POLARDB中，当POLARDB一主一从的模式不足以应对时，可以快速进行扩展，扩展成一主两从甚至N从。这种扩展区别于MySQL，他提供了敏捷性和业务弹性。如果数据量比较大，MySQL只读库的生成可能就需要数个小时的时间。而不管数据量多大，在POLARDB生态下创建一个只读库只需要分钟级的时间。并且只需要一份数据就可以通过POLARMPP来驱动业务报表。

云原生架构带来如下的业务收益：
1. 业务兼容，不改应用：只要是利用MySQL开发的业务系统，可以1. 无缝迁移到POLARDB上。
2. 读写分离：通过POLARDB，一份数据即可实现多个节点的读写分离，并且支持分钟级的扩展。如果用MySQL 实现读写分离，需要通过数据复制生成多个只读库，浪费时间，浪费空间。
3. 实时分析，数据共享：在数据仓库和BI分析业务中，也只需要一份数据，不需要进行数据复制。
4. 只读实例共享一份数据：由于存储只需要一份，带来了更好的性价比，以一主五从的架构为例，POLARDB的价格要比MySQL低44%。它在提供更强大的性能的基础上，提供了更高的性价比。
5. 毫秒级的延迟：由于主库和从库共享一份数据，因此中间只存在毫秒级的延迟。当主节点发生故障时，可以保证切换中的零数据丢失。
6. Session级读写分离的数据一致性：在金融等一致性要求高的业务场景下，对读一致性的要求非常高，很难容忍秒级甚至毫秒级的数据延迟。利用POLARDB可以实现session内的数据一致性读。
7. 按需付费，秒级备份：在使用MySQL的时候，如果预计要使用500GB的容量，我们需要买500G的存储空间，但实际上数据可能只占了不到100GB，但还是需要为500GB的预留容量买单。但POLARDB不需要做空间预留，存储按需付费。同时，POLARDB通过数据快照可以在秒级实现备份和恢复，更利于我们做数据库安全运维，带来更多价值。

云原生数据库如何打造业务弹性

应用架构的变迁——为什么我们需要超级MySQL？

实战——阿里云数据库为业务架构变迁做好准备

演进路线

应用链路的优化——自动读写分离，短连接优化

实时分析数据仓库——POLARMPP，POLARDB最佳搭档

业务场景分析——互联网创新型应用场景实践

关系型数据库

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

云原生数据库如何打造业务弹性

应用架构的变迁——为什么我们需要超级MySQL？

实战——阿里云数据库为业务架构变迁做好准备

演进路线

应用链路的优化——自动读写分离，短连接优化

实时分析数据仓库——POLARMPP，POLARDB最佳搭档

业务场景分析——互联网创新型应用场景实践

关系型数据库

热门文章

最新文章

相关课程

相关电子书

相关实验场景