关于负载均衡的一切

简介: 负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据均匀分摊到多个操作单元上执行,负载均衡的关键在于均匀。

什么是负载均衡?

负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据均匀分摊到多个操作单元上执行,负载均衡的关键在于均匀。

常见的负载均衡方案有哪些?

image.png

常见互联网分布式架构如上,分为:

  • 客户端层
  • 反向代理层
  • 站点层
  • 服务层
  • 数据层

可以看到,每一个下游都有多个上游调用,只需要做到,每一个上游都均匀访问每一个下游,就能实现整体的均匀分摊。

第一层:客户端层到反向代理层

image.png

客户端层到反向代理层的负载均衡,是通过“DNS轮询”实现的。

DNS-server对于一个域名配置了多个解析ip,每次DNS解析请求来访问DNS-server,会轮询返回这些ip,保证每个ip的解析概率是相同的。这些ip就是nginx的外网ip,以做到每台nginx的请求分配也是均衡的。

第二层:反向代理层到站点层

image.png

反向代理层到站点层的负载均衡,是通过“nginx”实现的。

画外音:nginx是反向代理的泛指。

修改nginx.conf,可以实现多种均衡策略:

(1) 请求轮询:和DNS轮询类似,请求依次路由到各个web-server;

(2) 最少连接路由:哪个web-server的连接少,路由到哪个web-server;

(3) ip哈希:按照访问用户的ip哈希值来路由web-server,只要用户的ip分布是均匀的,请求理论上也是均匀的,ip哈希均衡方法可以做到,同一个用户的请求固定落到同一台web-server上,此策略适合有状态服务,例如session;

画外音:站点层可以存储session,但强烈不建议这么做,站点层无状态是分布式架构设计的基本原则之一,session最好放到数据层存储。

(4) …

第三层:站点层到服务层

image.png

站点层到服务层的负载均衡,是通过“服务连接池”实现的。

上游连接池会建立与下游服务多个连接,每次请求会“随机”选取连接来访问下游服务。除了负载均衡,服务连接池还能够实现故障转移、超时处理、限流限速、ID串行化等诸多功能。

第四层:访问数据层

在数据量很大的情况下,由于数据层(db/cache)涉及数据的水平切分,所以数据层的负载均衡更为复杂一些,它分为“数据的均衡”,与“请求的均衡”。

数据的均衡是指:水平切分后的每个服务(db/cache),数据量是均匀的。

请求的均衡是指:水平切分后的每个服务(db/cache),请求量是均匀的。

业内常见的水平切分方式有这么几种:

一、按照range水平切分

image.png

每一个数据服务,存储一定范围的数据:

  • user0服务:存储uid范围1-1kw
  • user1服务:存储uid范围1kw-2kw

这个方案的好处是:

  • 规则简单,service只需判断一下uid范围就能路由到对应的存储服务
  • 数据均衡性较好
  • 比较容易扩展,可以随时加一个uid[2kw,3kw]的数据服务

不足是:

请求的负载不一定均衡,一般来说,新注册的用户会比老用户更活跃,大range的服务请求压力会更大

二、按照id哈希水平切分

image.png

每一个数据服务,存储某个key值hash后的部分数据:

  • user0服务:存储偶数uid数据
  • user1服务:存储奇数uid数据

这个方案的好处是:

  • 规则简单,service只需对uid进行hash能路由到对应的存储服务
  • 数据均衡性较好
  • 请求均匀性较好

不足是:

  • 不容易扩展,扩展一个数据服务,hash方法改变时候,可能需要进行数据迁移

总结
负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指,将请求/数据均匀分摊到多个操作单元上执行,其的关键在于均匀:

  • 反向代理层的负载均衡,是通过“DNS轮询”实现的
  • 站点层的负载均衡,是通过“nginx”实现的
  • 服务层的负载均衡,是通过“服务连接池”实现的
  • 数据层的负载均衡,要考虑“数据的均衡”与“请求的均衡”两个点,常见的方式有“按照范围水平切分”与“hash水平切分”

希望大家有收获。

架构师之路-分享可落地的技术文章

相关实践学习
部署高可用架构
本场景主要介绍如何使用云服务器ECS、负载均衡SLB、云数据库RDS和数据传输服务产品来部署多可用区高可用架构。
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
目录
相关文章
|
7月前
|
负载均衡 网络协议 算法
对负载均衡的全面理解
对负载均衡的全面理解
51 1
|
负载均衡 算法 网络协议
|
缓存 负载均衡 算法
负载均衡浅谈
在互联网尤其是移动互联网行业中一旦用户量达到一定数量级别之后,会面对高并发和海量数据的挑战,面对这种挑战必须提升系统整体的性能,可以采用垂直扩展和水平扩展两种方式。负载均衡是一种水平扩展的方式,它是建立在现有网络结构之上,它提供了一种有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。
164 0
负载均衡浅谈
|
负载均衡 网络协议 应用服务中间件
服务器负载均衡
服务器负载均衡
120 0
|
弹性计算 负载均衡 Linux
集群及负载均衡
对比基于反向代理的负载均衡与阿里云的负载均衡服务
 集群及负载均衡
|
弹性计算 负载均衡 Linux
集群及负载均衡
对比基于反向代理的负载均衡与阿里云的负载均衡服务
|
负载均衡 前端开发 应用服务中间件
负载均衡的介绍 | 学习笔记
快速学习负载均衡的介绍
99 0
负载均衡的介绍 | 学习笔记
|
缓存 负载均衡 网络协议
负载均衡是什么?
负载均衡知识介绍
245 1
|
弹性计算 负载均衡 算法
记一次负载均衡的配置和使用
负载均衡,英文名称为Load Balance,其含义就是指将负载(工作任务)进行平衡、分摊到多个操作单元上进行运行,例如FTP服务器、Web服务器、企业核心应用服务器和其它主要任务服务器等,从而协同完成工作任务。 负载均衡构建在原有网络结构之上,它提供了一种透明且廉价有效的方法扩展服务器和网络设备的带宽、加强网络数据处理能力、增加吞吐量、提高网络的可用性和灵活性。
133 0
记一次负载均衡的配置和使用
|
域名解析 缓存 负载均衡
简单聊聊负载均衡的那些事
负载均衡(Load balance,LB),是一种计算机技术,用来在多个计算机(计算机集群)、网络连接、CPU、磁盘驱动器或其他资源中分配负载,以达到最优化资源使用、最大化吞吐率、最小化响应时间、同时避免过载的目的。
194 1
简单聊聊负载均衡的那些事

相关实验场景

更多