状态同步,究竟是推还是拉?

简介: 状态同步,有好友状态的同步,有群友状态的同步,有的需要实时同步,有的能够容忍延时。结合具体场景来看下,状态同步,究竟是推还是拉。

任何脱离业务的架构设计都是耍流氓。

状态同步,有好友状态的同步,有群友状态的同步,有的需要实时同步,有的能够容忍延时。结合具体场景来看下,状态同步,究竟是推还是拉。

用户的在线状态,分为客户端状态(端),服务端状态(云)两种形态。

什么是服务端状态?

服务端状态,主要分为在线online和离线offline,不同的状态,对于不同的业务处理流程可能不同。例如对于消息的处理:

  • 服务端状态在线,直接投递给用户
  • 服务端状态离线,直接存储离线消息,等用户下一次登录拉取

如何实时更新服务端状态?

用户uid-A登录时,会修改用户的服务端状态为在线。

image.png

用户uid-A登出时,会修改用户的服务端状态为离线。

image.png

经常的,服务端会将用户的服务端状态存储在高可用的缓存集群里。

什么是客户端状态?

不同的产品,会有不同的客户端状态,例如隐身、离线、忙碌、勿扰等,这些状态大多是产品功能需求。有的产品,例如微信,在设计之初,就摒弃了用户端状态这个概念。

后文为了方便描述,不妨设待讨论的是QQ这种拥有客户端状态的产品,并假设客户端状态也只有在线和离线两种状态,后文统一称为“用户状态”。

如何获取好友的状态?

uid-A登录时,先去数据库拉取自己的好友列表,再去缓存获取所有好友的状态。

image.png

用户uid-A的好友uid-B状态改变时(由登录、登出等动作触发),uid-A如何同步这一事件?

这里就有推拉的设计折衷了。

  • 如果对于状态变更实时性要求不高,可以采用拉取

uid-A向服务器轮询拉取uid-B(其实是自己的全部好友)的状态,例如每1分钟一次,其缺点是:

(1)如果uid-B的状态改变,uid-A获取不实时,可能有1分钟时延

(2)如果uid-B的状态不改变,uid-A会有大量无效的轮询请求,非常低效

  • 如果对于状态变更实时性要求较高,则必须推送

uid-B状态改变时(由登录、登出等动作触发),服务端不仅要在缓存中修改uid-B的状态,还要将这个状体改变的通知推送给uid-B的在线好友。

image.png

推送的优势是:实时

缺点是:当在线好友量很大时,任何一个用户状态的改变,会扩散成N个实时通知,这个N叫做“消息风暴扩散系数”。假设一个IM系统平均每个用户有200个好友,平均有20%的好友在线,那么消息风暴扩散系数N=40,这意味着,任何一个状态的变化会变成40个推送请求。

群友状态的一致性,和好友状态的一致性相比,复杂在哪里?可不可以采用实时推送?

群这个业务场景大伙也非常之熟悉,你能够加入若干群(例如20个),假设平均每个群有200人,即你会有4000个群友。

理论上群友状态也可以通过实时推送的方式实现,以保证实时性。进一步讨论之前,先一起估算下这个业务场景下的“消息风暴扩散系数”。

假设平均每个用户加了20个群,平均每个群有200个用户,依然假设20%的用户在线,那么为了保证群友状态的实时性,每个用户登录,就要将自己的状态改变通知发送给2020020%=800个群友,N=800,意味着,任何一个状态的变化会变成800个推送请求。如果说好友状态实时推送,消息风暴扩散系数N=40尚可以接受,那么群友状态实时推送,N=800则是灾难性的。此类业务往往采用轮询拉取的方式,获得群友的状态。

轮询拉取群友状态也会给服务器带来过大的压力,还有什么优化方式?

群友的数据量太大,虽然每个用户平均加入了20个群,但实际上并不会每次登录都进入每一个群。不采用轮询拉取,而采用按需拉取,延时拉取的方式,在真正进入一个群时才实时拉取群友的在线状态,是既能满足用户需求(用户感觉是状态是实时、一致的,但其实是进入群才拉取的),又能降低服务器压力。这是一种常见方法。

总结

状态的实时性与一致性是一个较难解决的技术问题,不同的业务实现方式不同,一般来说:

  • 好友状态同步,是采用推送的方式同步
  • 群友状态同步,由于消息风暴扩散系数过大,一般采用拉取的方式同步
  • 群友状态同步,还能采用按需拉取的优化方式,进一步降低服务端压力
  • “消息风暴扩散系数”是指一个消息发出时,变成N个消息的扩散系数,这个系数一定程度上决定了技术采用推送还是拉取
目录
相关文章
|
4月前
|
前端开发 Cloud Native 大数据
坑爹,线上同步近 3w 个用户导致链路阻塞引入发的线上问题,你经历过吗?
坑爹,线上同步近 3w 个用户导致链路阻塞引入发的线上问题,你经历过吗?
b站如何一次性把up主全部取消关注,让自己去学习
b站如何一次性把up主全部取消关注,让自己去学习
|
9月前
|
消息中间件 网络性能优化 API
推或拉? rabbitMQ 消费模式该如何选择
推或拉? rabbitMQ 消费模式该如何选择
270 1
|
消息中间件 缓存 uml
面试官:RocketMQ 的推模式和拉模式有什么区别?
面试官:RocketMQ 的推模式和拉模式有什么区别?
444 1
面试官:RocketMQ 的推模式和拉模式有什么区别?
|
消息中间件 存储 设计模式
一文读懂kafka消息拉取机制|线程拉取模型
一文读懂kafka消息拉取机制|线程拉取模型
一文读懂kafka消息拉取机制|线程拉取模型
|
JSON 安全 机器人
拉仇恨!webhook + 企业微信给同事做了个代码提交监听工具
拉仇恨!webhook + 企业微信给同事做了个代码提交监听工具
1335 1
拉仇恨!webhook + 企业微信给同事做了个代码提交监听工具
|
存储 监控 网络协议
|
存储 架构师 数据库
几万条群离线消息,如何高效拉取,会不会丢?
群离线消息一般采用拉取模式,只存一份,不需要为每个用户存储离线群msg_id,只需存储一个最近ack的群消息id/time;为了保证消息可达性,在线消息和离线消息都需要ACK;离线消息过多,可以分群拉取、分页拉取等优化;如果收到重复消息,需要msg_id去重,让用户无感知。
857 0
几万条群离线消息,如何高效拉取,会不会丢?