Redlock:Redis分布式锁最牛逼的实现

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介:

普通实现

说道Redis分布式锁大部分人都会想到: setnx+lua,或者知道 setkey value px milliseconds nx。后一种方式的核心实现命令如下:

 
  1. - 获取锁(unique_value可以是UUID等)

  2. SET resource_name unique_value NX PX 30000


  3. - 释放锁(lua脚本中,一定要比较value,防止误解锁)

  4. if redis.call("get",KEYS[1]) == ARGV[1] then

  5. return redis.call("del",KEYS[1])

  6. else

  7. return 0

  8. end

这种实现方式有3大要点(也是面试概率非常高的地方):

  1. set命令要用 setkey value px milliseconds nx

  2. value要具有唯一性;

  3. 释放锁时要验证value值,不能误解锁;

事实上这类琐最大的缺点就是它加锁时只作用在一个Redis节点上,即使Redis通过sentinel保证高可用,如果这个master节点由于某些原因发生了主从切换,那么就会出现锁丢失的情况:

  1. 在Redis的master节点上拿到了锁;

  2. 但是这个加锁的key还没有同步到slave节点;

  3. master故障,发生故障转移,slave节点升级为master节点;

  4. 导致锁丢失。

正因为如此,Redis作者antirez基于分布式环境下提出了一种更高级的分布式锁的实现方式:Redlock。笔者认为,Redlock也是Redis所有分布式锁实现方式中唯一能让面试官高潮的方式。

Redlock实现

antirez提出的redlock算法大概是这样的:

在Redis的分布式环境中,我们假设有N个Redis master。这些节点完全互相独立,不存在主从复制或者其他集群协调机制。我们确保将在N个实例上使用与在Redis单实例下相同方法获取和释放锁。现在我们假设有5个Redis master节点,同时我们需要在5台服务器上面运行这些Redis实例,这样保证他们不会同时都宕掉。

为了取到锁,客户端应该执行以下操作:

  • 获取当前Unix时间,以毫秒为单位。

  • 依次尝试从5个实例,使用相同的key和具有唯一性的value(例如UUID)获取锁。当向Redis请求获取锁时,客户端应该设置一个网络连接和响应超时时间,这个超时时间应该小于锁的失效时间。例如你的锁自动失效时间为10秒,则超时时间应该在5-50毫秒之间。这样可以避免服务器端Redis已经挂掉的情况下,客户端还在死死地等待响应结果。如果服务器端没有在规定时间内响应,客户端应该尽快尝试去另外一个Redis实例请求获取锁。

  • 客户端使用当前时间减去开始获取锁时间(步骤1记录的时间)就得到获取锁使用的时间。当且仅当从大多数(N/2+1,这里是3个节点)的Redis节点都取到锁,并且使用的时间小于锁失效时间时,锁才算获取成功

  • 如果取到了锁,key的真正有效时间等于有效时间减去获取锁所使用的时间(步骤3计算的结果)。

  • 如果因为某些原因,获取锁失败(没有在至少N/2+1个Redis实例取到锁或者取锁时间已经超过了有效时间),客户端应该在所有的Redis实例上进行解锁(即便某些Redis实例根本就没有加锁成功,防止某些节点获取到锁但是客户端没有得到响应而导致接下来的一段时间不能被重新获取锁)。

Redlock源码

redisson已经有对redlock算法封装,接下来对其用法进行简单介绍,并对核心源码进行分析(假设5个redis实例)。

POM依赖

 
  1. <!-- https://mvnrepository.com/artifact/org.redisson/redisson -->

  2. <dependency>

  3. <groupId>org.redisson</groupId>

  4. <artifactId>redisson</artifactId>

  5. <version>3.3.2</version>

  6. </dependency>

用法

首先,我们来看一下redission封装的redlock算法实现的分布式锁用法,非常简单,跟重入锁(ReentrantLock)有点类似:

 
  1. Config config = new Config();

  2. config.useSentinelServers().addSentinelAddress("127.0.0.1:6369","127.0.0.1:6379", "127.0.0.1:6389")

  3. .setMasterName("masterName")

  4. .setPassword("password").setDatabase(0);

  5. RedissonClient redissonClient = Redisson.create(config);

  6. // 还可以getFairLock(), getReadWriteLock()

  7. RLock redLock = redissonClient.getLock("REDLOCK_KEY");

  8. boolean isLock;

  9. try {

  10. isLock = redLock.tryLock();

  11. // 500ms拿不到锁, 就认为获取锁失败。10000ms即10s是锁失效时间。

  12. isLock = redLock.tryLock(500, 10000, TimeUnit.MILLISECONDS);

  13. if (isLock) {

  14. //TODO if get lock success, do something;

  15. }

  16. } catch (Exception e) {

  17. } finally {

  18. // 无论如何, 最后都要解锁

  19. redLock.unlock();

  20. }

唯一ID

实现分布式锁的一个非常重要的点就是set的value要具有唯一性,redisson的value是怎样保证value的唯一性呢?答案是UUID+threadId。入口在redissonClient.getLock("REDLOCK_KEY"),源码在Redisson.java和RedissonLock.java中:

 
  1. protected final UUID id = UUID.randomUUID();

  2. String getLockName(long threadId) {

  3. return id + ":" + threadId;

  4. }

获取锁

获取锁的代码为redLock.tryLock()或者redLock.tryLock(500, 10000, TimeUnit.MILLISECONDS),两者的最终核心源码都是下面这段代码,只不过前者获取锁的默认租约时间(leaseTime)是LOCKEXPIRATIONINTERVAL_SECONDS,即30s:

 
  1. <T> RFuture<T> tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadId, RedisStrictCommand<T> command) {

  2. internalLockLeaseTime = unit.toMillis(leaseTime);

  3. // 获取锁时向5个redis实例发送的命令

  4. return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, command,

  5. // 首先分布式锁的KEY不能存在,如果确实不存在,那么执行hset命令(hset REDLOCK_KEY uuid+threadId 1),并通过pexpire设置失效时间(也是锁的租约时间)

  6. "if (redis.call('exists', KEYS[1]) == 0) then " +

  7. "redis.call('hset', KEYS[1], ARGV[2], 1); " +

  8. "redis.call('pexpire', KEYS[1], ARGV[1]); " +

  9. "return nil; " +

  10. "end; " +

  11. // 如果分布式锁的KEY已经存在,并且value也匹配,表示是当前线程持有的锁,那么重入次数加1,并且设置失效时间

  12. "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +

  13. "redis.call('hincrby', KEYS[1], ARGV[2], 1); " +

  14. "redis.call('pexpire', KEYS[1], ARGV[1]); " +

  15. "return nil; " +

  16. "end; " +

  17. // 获取分布式锁的KEY的失效时间毫秒数

  18. "return redis.call('pttl', KEYS[1]);",

  19. // 这三个参数分别对应KEYS[1],ARGV[1]和ARGV[2]

  20. Collections.<Object>singletonList(getName()), internalLockLeaseTime, getLockName(threadId));

  21. }

获取锁的命令中,

  • KEYS[1] 就是Collections.singletonList(getName()),表示分布式锁的key,即REDLOCK_KEY;

  • ARGV[1] 就是internalLockLeaseTime,即锁的租约时间,默认30s;

  • ARGV[2] 就是getLockName(threadId),是获取锁时set的唯一值,即UUID+threadId:


释放锁

释放锁的代码为redLock.unlock(),核心源码如下:

 
  1. protected RFuture<Boolean> unlockInnerAsync(long threadId) {

  2. // 向5个redis实例都执行如下命令

  3. return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,

  4. // 如果分布式锁KEY不存在,那么向channel发布一条消息

  5. "if (redis.call('exists', KEYS[1]) == 0) then " +

  6. "redis.call('publish', KEYS[2], ARGV[1]); " +

  7. "return 1; " +

  8. "end;" +

  9. // 如果分布式锁存在,但是value不匹配,表示锁已经被占用,那么直接返回

  10. "if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then " +

  11. "return nil;" +

  12. "end; " +

  13. // 如果就是当前线程占有分布式锁,那么将重入次数减1

  14. "local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); " +

  15. // 重入次数减1后的值如果大于0,表示分布式锁有重入过,那么只设置失效时间,还不能删除

  16. "if (counter > 0) then " +

  17. "redis.call('pexpire', KEYS[1], ARGV[2]); " +

  18. "return 0; " +

  19. "else " +

  20. // 重入次数减1后的值如果为0,表示分布式锁只获取过1次,那么删除这个KEY,并发布解锁消息

  21. "redis.call('del', KEYS[1]); " +

  22. "redis.call('publish', KEYS[2], ARGV[1]); " +

  23. "return 1; "+

  24. "end; " +

  25. "return nil;",

  26. // 这5个参数分别对应KEYS[1],KEYS[2],ARGV[1],ARGV[2]和ARGV[3]

  27. Arrays.<Object>asList(getName(), getChannelName()), LockPubSub.unlockMessage, internalLockLeaseTime, getLockName(threadId));


  28. }

参考:https://redis.io/topics/distlock


原文发布时间为: 2018-12-02
本文作者:阿飞的博客
本文来自云栖社区合作伙伴“Java技术驿站”,了解相关信息可以关注“Java技术驿站”。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
1月前
|
NoSQL 算法 安全
Redlock 算法-主从redis分布式锁主节点宕机锁丢失的问题
Redlock 算法-主从redis分布式锁主节点宕机锁丢失的问题
152 0
|
1月前
|
NoSQL 关系型数据库 MySQL
分布式锁(redis/mysql)
分布式锁(redis/mysql)
55 1
|
22天前
|
NoSQL Java Redis
如何通俗易懂的理解Redis分布式锁
在多线程并发的情况下,我们如何保证一个代码块在同一时间只能由一个线程访问呢?
31 2
|
1月前
|
人工智能 监控 NoSQL
【万字长文 一文搞定】Redis:从新手村到大师殿堂的奥德赛之旅 9种实现分布式锁的全技术指南
【万字长文 一文搞定】Redis:从新手村到大师殿堂的奥德赛之旅 9种实现分布式锁的全技术指南
80 4
|
1月前
|
消息中间件 存储 NoSQL
【Redis项目实战】使用Springcloud整合Redis分布式锁+RabbitMQ技术实现高并发预约管理处理系统
【Redis项目实战】使用Springcloud整合Redis分布式锁+RabbitMQ技术实现高并发预约管理处理系统
|
机器学习/深度学习 缓存 NoSQL
|
缓存 NoSQL Java
为什么分布式一定要有redis?
1、为什么使用redis 分析:博主觉得在项目中使用redis,主要是从两个角度去考虑:性能和并发。当然,redis还具备可以做分布式锁等其他功能,但是如果只是为了分布式锁这些其他功能,完全还有其他中间件(如zookpeer等)代替,并不是非要使用redis。
1330 0
|
8天前
|
NoSQL Linux Redis
06- 你们使用Redis是单点还是集群 ? 哪种集群 ?
**Redis配置:** 使用哨兵集群,结构为1主2从,加上3个哨兵节点,总计分布在3台Linux服务器上,提供高可用性。
17 0
|
16天前
|
负载均衡 监控 NoSQL
Redis的集群方案有哪些?
Redis集群包括主从复制(基础,手动故障恢复)、哨兵模式(自动高可用)和Redis Cluster(官方分布式解决方案,自动分片和容错)。此外,还有如Codis、Redisson和Twemproxy等第三方工具用于代理和负载均衡。选择方案需考虑应用场景、数据规模和并发需求。
17 2
|
22天前
|
NoSQL Redis
Redis集群(六):集群常用命令及说明
Redis集群(六):集群常用命令及说明
15 0

热门文章

最新文章