浅谈CAS在分布式ID生成方案上的应用 | 架构师之路

简介: 本文介绍了CAS在分布式ID生成方案上的一种应用,更多的分布式ID生成方案,请参考《细聊分布式ID生成器架构》。

近几篇文章聊CAS被骂得较多,今天还是聊CAS,谈谈CAS在一种“分布式ID生成方案”上的应用。

所谓“分布式ID生成方案”,是指在分布式环境下,生成全局唯一ID的方法。

可以利用DB自增键(auto inc id)来生成全局唯一ID,插入一条记录,生成一个ID:

image.png

这个方案利用了数据库的单点特性,其优点为:

无需写额外代码

全局唯一

绝对递增

递增ID的步长确定

其不足为:

需要做数据库HA,保证生成ID的高可用

数据库中记录数较多

生成ID的性能,取决于数据库插入性能

优化方案为:

利用双主保证高可用

定期删除数据

增加一层服务,采用批量生成的方式降低数据库的写压力,提升整体性能

增加服务后,DB中只需保存当前最大的ID即可,在服务启动初始化的过程中,首先拉取当前的max-id:

image.png

select max_id from T;

然后批量获取一批ID,放到id-servcie内存里,并将max-id写回数据库:

image.png

update T set max_id=200;

这样,id-service就拿到了[100, 200]这一批ID,上游在获取ID时,不用每次都插入数据库,而是分配完100个ID后,再修改max-id的值,这样分配ID的整体性能就增加了100倍。

这个方案的优点:

数据库只保存一条记录

性能极大增强

其不足为:

如果id-service重启,可能内存会有一段已经申请的ID没有分配出去,导致ID空洞,当然,这不是一个严重的问题

服务没有做HA,无法保证高可用

优化方案为:

冗余服务,做集群保证高可用

冗余了服务后,多个服务在启动过程中,进行ID批量申请时,可能由于并发导致数据不一致:

image.png

select max_id from T;

如上图所示,两个id-service在启动的过程中,同时拿到了max-id为100。

两个id-service同时对数据库的max-id进行写回:

image.png

update T set max_id=200;

写回max-id成功后,这两个id-service都以为自己拿到了[100,200]这一批ID,导致集群会生成重复的ID。

问题发生的原因,是并发写回时,没有对max-id的初始值进行比对:

id-service1写回max-id=200成功的条件是,max-id必须等于100

id-service2写回max-id=200成功的条件是,max-id也必须等于100

id-service1写回时,max-id是100,理应写回成功

id-service2写回时,max-id已经被改成了200,不应该写回成功

只要实施CAS乐观锁,在写回时对max-id的初始条件进行比对,就能避免数据的不一致,写回SQL由:

update T set max_id=200;

升级为:

update T set max_id=200 where max_id=100;

这样,id-service2写回时,就会失败:

image.png

失败后,id-service2要再次查询max-id:

image.png

此时max-id已经变为200,于是id-service2获取到了[200, 300]这一批ID,并将max-id=300写回:

image.png

update t set max_id=300 where max_id=200;

写回成功。

这种方案的好处是:

能够通过水平扩展的方式,达到分布式ID生成服务的无限性能

使用CAS简洁的保证不会生成重复的ID

其不足为:

由于有多个service,生成的ID 不是绝对递增的,而是趋势递增的

本文介绍了CAS在分布式ID生成方案上的一种应用,更多的分布式ID生成方案,请参考《细聊分布式ID生成器架构》。

==【完】==

目录
相关文章
|
12天前
|
机器学习/深度学习 API 语音技术
|
25天前
|
设计模式 安全 Java
【分布式技术专题】「Tomcat技术专题」 探索Tomcat技术架构设计模式的奥秘(Server和Service组件原理分析)
【分布式技术专题】「Tomcat技术专题」 探索Tomcat技术架构设计模式的奥秘(Server和Service组件原理分析)
29 0
|
2天前
|
存储 关系型数据库 分布式数据库
电子好书发您分享《PolarDB分布式版架构介绍PolarDB分布式版架构介绍》
**《PolarDB分布式版架构介绍》电子书分享:** 探索阿里云PolarDB分布式设计,采用计算存储分离,借助GMS、CN组件实现大规模扩展。[阅读更多](https://developer.aliyun.com/ebook/8332/116553?spm=a2c6h.26392459.ebook-detail.5.3b3b2ccbVVjjt0)
12 3
|
1天前
|
存储 SQL 关系型数据库
电子好书发您分享《PolarDB分布式版架构介绍》
**PolarDB分布式版详解:** 阿里云的PolarDB采用计算存储分离架构,利用GMS进行元数据管理,CN处理分布式SQL。结合PolarFS,实现高效存储与计算,支持大规模扩展。[阅读完整架构介绍](https://developer.aliyun.com/ebook/8332/116553?spm=a2c6h.26392459.ebook-detail.5.5b912ccbE20nqg)
|
3天前
|
存储 关系型数据库 分布式数据库
电子好书发您分享《PolarDB分布式版架构介绍》
**探索PolarDB分布式版:阿里巴巴云的高扩展数据库解决方案,采用计算存储分离架构,确保高性能和弹性扩展。[阅读详情](https://developer.aliyun.com/ebook/8332/116553?spm=a2c6h.26392459.ebook-detail.5.33ac2ccbVd9TB2)**
90 7
|
5天前
|
存储 SQL 算法
搞定了 6 种分布式ID,分库分表哪个适合做主键?
在《ShardingSphere5.x分库分表原理与实战》系列的第七篇文章中,作者探讨了分布式ID在分库分表中的重要性,以及如何利用`ShardingSphere-jdbc`的多种主键生成策略。文章介绍了`UUID`、`NanoID`、自定义雪花算法和`CosId`等策略的优缺点,并警告不要在SQL中手动拼接主键字段。此外,文章还展示了如何配置这些策略,并提醒读者`CosId`在5.2.0版本可能不可用。最后,文章讨论了如何自定义分布式主键生成算法,并强调选择策略时要考虑全局唯一性、性能和易用性。
|
7天前
|
人工智能 Serverless 数据处理
利用阿里云函数计算实现 Serverless 架构的应用
阿里云函数计算是事件驱动的Serverless服务,免服务器管理,自动扩展资源。它降低了基础设施成本,提高了开发效率,支持Web应用、数据处理、AI和定时任务等多种场景。通过实例展示了如何用Python实现图片压缩应用,通过OSS触发函数自动执行。阿里云函数计算在云计算时代助力企业实现快速迭代和高效运营。
43 0
|
11天前
|
运维 监控 自动驾驶
构建可扩展的应用程序:Apollo与微服务架构的完美结合
构建可扩展的应用程序:Apollo与微服务架构的完美结合
32 10
|
12天前
|
机器学习/深度学习 PyTorch API
|
12天前
|
机器学习/深度学习 语音技术 算法框架/工具