如何用Redis平衡海量信息推送的实效与体量

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 当用户在领劵中心订阅了某个劵的领取提醒后,在后台就会生成一条用户的订阅提醒记录,里面记录了在哪个时间点给用户发送推送信息。所以问题就变成了系统如何快速实时选出哪些要推送的记录。

前阵子开发了公司领劵中心的项目,这个项目是以Redis作为关键技术落地的。

其中有一个功能叫做领劵的订阅推送。什么是领劵的订阅推送?就是用户订阅了该劵的推送,在可领取前的一分钟就要把提醒信息推送到用户的App中。本来这个订阅功能应该是消息中心那边做的,但他们说这个短时间内做不了,所以让我这个负责优惠劵的做了。具体方案就是到具体的推送时间点了,Coupon系统调用消息中心的推送接口,把信息推送出去。

下面我们分析一下这个功能的业务情景:

公司目前注册用户6000W+,是哪家就不要打听了,比如有一张无门槛的优惠劵下单立减20元,那么抢这张劵的人就会比较多,我们保守估计10W+,百万级别不好说。我们初定为20W万人,那么这20W条推送信息要在一分钟推送完成,并且一个用户是可以订阅多张劵的。所以我们知道了这个订阅功能有两个突出的难点:

推送的实效性:推送慢了,用户会抱怨没有及时通知他们错过了开抢时机;
推送的体量大:爆款的神劵,人人都想抢。

然而推送体量又会影响到推送的实效性。这真是一个让人头疼的问题……那就让我们把问题一个个解决掉吧!

推送的实效性的问题

当用户在领劵中心订阅了某个劵的领取提醒后,在后台就会生成一条用户的订阅提醒记录,里面记录了在哪个时间点给用户发送推送信息。所以问题就变成了系统如何快速实时选出哪些要推送的记录。

方案1:MQ的延迟投递

MQ虽然支持消息的延迟投递但尺度太大1s 5s 10s 30s 1m,用来做精确时间点投递不行。并且用户执行订阅之后又取消订阅的话,要把发出去的MQ消息Delete掉这个操作有点头大,短时间内难以落地,而且用户可以取消之后再订阅,这又涉及到去重的问题,所以MQ的方案否掉。

方案2:传统定时任务

这个相对来说就简单一点,用定时任务是去DB里面Load用户的订阅提醒记录,从中选出当前可以推送的记录。但有句话说得好任何脱离实际业务的设计都是耍流氓,下面我们就分析一下传统的定时任务到底适不适合我们的这个业务:

image

综上所述,我们就知道了一般传统的定时任务存在以下缺点:

性能瓶颈。只有一台机在处理,在大体量数据面前力不从心;
实效性差。定时任务的频率不能太高,太高会给业务数据库造成很大的压力;
单点故障。万一跑的那台机挂了,那整个业务不可用了,这是一个很可怕的事情。

所以传统定时任务也不太适合这个业务。

那我们是不是就束手无策了呢?其实不是的。我们只要对传统的定时任务做一个简单的改造,就可以把它变成可以同时多机跑,而且实效性可以精确到秒级,同时拒绝单点故障的定时任务集群。这其中就要借助我们的强大的Redis了。

方案3:定时任务集群

首先我们要定义定时任务集群要解决的三个问题:

实效性要高
吞吐量要大
服务要稳定,不能有单点故障

下面是整个定时任务集群的架构图:

image

架构很简单:我们把用户的订阅推送记录存储到Redis集群的SortedSet队列里面,并且以提醒用户提醒时间戳作为Score值,然后在我们个每业务Server里面起一个定时器频率是秒级,我的设定就是1s,然后经过负载均衡之后从某个队列里面获取要推送的用户记录进行推送。

下面我们分析以下这个架构:

性能:除去带宽等其它因素,基本与机器数成线性相关,机器数量越多吞吐量越大,机器数量少时相对的吞吐量就减少;
实效性:提高到了秒级,效果还可以接受;
单点故障?不存在的!除非Redis集群或者所有Server全挂了……

为什么用Redis

这里解析一下为什么用Redis:

Redis可以作为一个高性能的存储DB,性能要比MySQL好很多,并且支持持久化,稳定性好。
Redis SortedSet队列天然支持以时间作为条件排序,完美满足我们选出要推送的记录。

ok~既然方案已经有了,那如何在一天时间内把这个方案落地呢?是的,我设计出这个方案到基本编码完成,时间就是一天,因为时间太赶鸟……

首先我们以user_Id作为Key,然后Mod队列数Hash到Redis SortedSet队列里面。为什么要这样?因为如果用户同时订阅了两张劵并且推送时间很近,这样的两条推送就可以合并成一条,并且hash也相对均匀。下面是部分代码的截图:


image


然后要决定队列的数量,一般正常来说我们有多少台处理的服务器就定义多少条队列,因为队列太少,会造成队列竞争,太多可能会导致记录得不到及时处理。

然而最佳实践是队列数量应该是可动态配置化的,因为线上的集群机器数是会经常变的。大促的时候一般我们会加机器,并且业务量增长了,机器数也是会增加。所以我是借用了淘宝的Diamond进行队列数的动态配置:

image

我们每次从队列里面取多少条记录也是可以动态配置的 :

image

这样就可以随时根据实际的生产情况调整整个集群的吞吐量,所以我们的定时任务集群还具有一个特性就是支持动态调整。

最后一个关键组件就是负载均衡了。这个是非常重要的,因为这个做得不好就会可能导致多台机竞争同时处理一个队列,影响整个集群的效率。在时间很紧的情况下,我就用了一个简单实用的利用Redis一个自增Key然后Mod队列数量算法。这样就很大程度上就保证不会有两台机器同时去竞争一条队列。

image

最后我们算一下整个集群的吞吐量:

10(机器数)*2000(一次拉取数)=20000。然后以MQ的形式把消息推送到消息中心,发MQ是异步的,算上其它处理0.5s。

其实发送20W的推送也就是十几s的事情。

ok~ 到这里我们整个定时任务集群就差不多基本落地好了。如果你问我后面还有什么可以完善的话那就是:

加监控, 集群怎么可以木有监控呢,万一出问题有任务堆积怎么办?
加上可视化界面;
最好有智能调度,增加任务优先级。优先级高的任务先运行嘛~
资源调度,万一机器数量不够,力不从心,优先保证重要任务执行。

目前项目已上前线,运行平稳~

原文发布时间为:2018-07-11
本文作者:浮云骑士LIN
本文来自云栖社区合作伙伴“DBAplus社群”,了解相关信息可以关注“DBAplus社群”。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
5月前
|
NoSQL Redis
shiro的session信息放redis反序列化异常解决
shiro的session信息放redis反序列化异常解决
|
3月前
|
NoSQL Linux 网络安全
解决在Linux中进行redis的主从复制时出现的从机可以获取到主机的信息,主机获取不到从机的信息~
解决在Linux中进行redis的主从复制时出现的从机可以获取到主机的信息,主机获取不到从机的信息~
|
10月前
|
存储 JSON 缓存
面试官:你觉得Redis存储对象信息是用Hash还是String好?
Redis 内部使用一个 RedisObject 对象来表示所有的 key 和 value,RedisObject 中的 type,则是代表一个 value 对象具体是何种数据类型,它包含字符串(String)、链表(List)、哈希结构(Hash)、集合(Set)、有序集合(Sorted set)。
|
10月前
|
NoSQL Redis
你真的了解Redis Info命令的统计信息吗
我们通常会使用info 命令获取当前redis 实例的详细信息,下面我整理了一份redis info 信息指南 查看统计信息
96 0
|
11月前
|
存储 运维 监控
Redis进阶 -CLUSTER NODES 信息结合实际输出信息解读
Redis进阶 -CLUSTER NODES 信息结合实际输出信息解读
71 0
|
11月前
|
缓存 NoSQL 测试技术
实战SSM_O2O商铺_46【Redis缓存】头条信息+商铺目录Service层加入缓存
实战SSM_O2O商铺_46【Redis缓存】头条信息+商铺目录Service层加入缓存
47 0
|
开发框架 监控 前端开发
云LIS平台源码,基于B/S架构的实验室信息系统,技术架构:Asp.NET CORE 3.1 MVC + SQLserver + Redis
支持Westguard,Gubbuss+T(n)等多种质控规则,自动判断是否失控,可自动计算靶值、SD,多个质控品可列于一个图表上;每个质控品每天可多达7次结果,可使用平均值、最后一次结果,最好一次结果画图等;靶值可自动计算,免疫等支持按季度或者自定义日期画图
云LIS平台源码,基于B/S架构的实验室信息系统,技术架构:Asp.NET CORE 3.1 MVC + SQLserver + Redis
|
NoSQL API Redis
实战:第十一篇:StringRedisTemplate获取redis信息
实战:第十一篇:StringRedisTemplate获取redis信息
267 0
实战:第十一篇:StringRedisTemplate获取redis信息
|
存储 NoSQL 安全
OAuth2使用Redis来存储客户端信息以及AccessToken
使用`Redis`来存储`OAuth2`相关的客户端信息以及生成的`AccessToken`是一个不错的选择,`Redis`与生俱来的的高效率、集群部署是比较出色的功能,如果用来作为`服务认证中心`的数据存储,可以大大的提高响应效率。
|
存储 JSON 缓存
Redis 存储结构体信息,选 hash 还是string?
Redis 存储结构体信息,选 hash 还是string?
180 0
Redis 存储结构体信息,选 hash 还是string?

热门文章

最新文章