如何用Go语言每分钟处理100万个请求

简介:

摘要:作者结合自身工作经历,以一个项目为案例,通过多个Go语言程序实例的尝试,阐述了Go语言是如何每分钟可以处理100万个请求的,以下是译文。

我在几个不同的公司从事反垃圾邮件,反病毒和反恶意软件工作超过15年,现在我知道这些系统的复杂性可能是由于我们每天处理的大量数据造成的。

目前,我是 smsjunk.com 的CEO和 KnowBe4 的首席架构师,两个活跃在网络安全行业的公司。

有趣的是,在过去10年左右的时间里,作为一名软件工程师,我所参与的所有web后端开发大部分都是以Ruby on Rails(Rails是使用Ruby语言编写的网页程序开发框架,目的是为开发者提供常用组件)开发的。不要误会我,我热爱Ruby on Rails,我相信它是一个令人着迷的开发环境,但一段时间后,你开始以Ruby的方式思考和设计系统,忘了如何高效和原本可以利用多线程、并行、快速执行和小的内存消耗来简化软件架构。多年来,我是一个C / C++、Delphi和C #开发人员,我刚刚意识到,用合适的工具来完成工作可能会降低事情的复杂度。

我不太热衷于开发语言和框架的战争,网站之间总是为此争吵。我相信效率、生产率和代码的可维护性主要取决于如何简单地构建解决方案。 问题

当我们在一个匿名的遥测和分析系统上工作时,我们的目标是能够处理来自数百万终端的大量的POST请求。Web处理程序将接收一个JSON文档,其中可能包含需要写入Amazon S3的许多有效负载的集合,这是为了使map-reduce系统稍后操作这个数据。

传统上,我们将研究创造一个一阶作业者架构,利用诸如:

  • Sidekiq
  • Resque
  • DelayedJob
  • Elasticbeanstalk Worker Tier
  • RabbitMQ
  • 等等…

设置2个不同的集群,一个用于web前端,另一个用于作业者,这样会扩大可以处理的后台工作的数量。

但从一开始,我们的团队就知道应该这样做,因为在讨论阶段,我们预见这可能是一个非常大的流量系统。我使用Go语言大约2年左右的时间,我们开发了一些在用的系统,但是没有一个系统能得到这么多的负载。

首先通过创建一些structure,定义通过POST调用来接收到的web请求负载,还有一个上传请求负载到S3 bucket的函数。

如何用Go语言每分钟处理100万个请求

Go语言程序的单纯方法

最初我们采取了一个非常单纯的POST处理方式,仅仅试图将任务并行化处理放到一个简单的goroutine:

如何用Go语言每分钟处理100万个请求

对于中等负载来说,这可能对大多数人是有效的,但这很快证明在大型负载时,效果不太好。我们预期有很多的请求,但当我们部署第一个版本到产品中时,并没有看到这个数量级的请求。我们完全低估了流量。

上面的方法在几个方面都不好,没有办法控制我们正在大量生产的Go程序要产生多少个例程。由于我们每分钟收到100万个POST请求,理所当然的,这段代码很快就崩溃了。

再次尝试

我们需要寻找一个不同的方式。从一开始,我们就讨论如何保持请求处理程序的生命周期非常短,并在后台生成处理进程。当然,这是必须在Ruby on Rails领域要做的,否则这将限制所有可用的web处理器,无论你使用的是puma, unicorn, passenger中的哪一个(请不要参加JRuby讨论)。那么我们就需要利用通用的解决方案去做这个,例如Resque, Sidekiq, SQS,等等。清单还可以继续列下去,因为有很多方法可以做到这一点。

所以第二个版本是创建一个缓存通道,在这里我们可以对一些作业进行排队并上传到S3,由于我们可以控制队列中的最大项目数,在内存中我们有足够多的RAM对任务进行排队,我们认为只在通道队列中缓存作业是可以的。

如何用Go语言每分钟处理100万个请求

然后实际上的作业出列和处理,我们使用的是类似的函数:

如何用Go语言每分钟处理100万个请求

说实话,我不知道我们在想什么。这一定是一个充满红牛的深夜。这种方法没有给我们带来任何好处,我们用缓冲队列来交换有缺陷的并发,也只是推迟了问题的产生时间而已。我们的同步处理器一次只上传一个有效负载到S3,而且由于传入请求的速率比单处理器上传到S3的能力大得多,所以缓冲通道很快就达到了极限,限制了请求处理程序来排队更多项目的能力。

我们只是简单地回避这个问题,最终导致系统的死亡。在我们部署了这个有缺陷的版本之后,我们的延迟率以不变的速率持续增长。

如何用Go语言每分钟处理100万个请求

更好的解决方案

当使用Go语言通道时,我们决定利用通用模式以便创造一个2阶的通道系统,一个用于作业排队,另外一个控制多少作业者同时在JobQueue上操作。

这个想法是以某种可持续的速度并行上传到S3,它既不会削弱机器性能,也不会从S3开始生成连接错误。所以我们选择了创建一个作业/作业者模式。对那些熟悉java,C#等语言的人来说,可以考虑采用Go语言实现通道方式而不是作业者线程池的方式。

如何用Go语言每分钟处理100万个请求如何用Go语言每分钟处理100万个请求如何用Go语言每分钟处理100万个请求

我们修改了Web请求处理程序,创建一个带负载的jobstruct实例,发送到JobQueue通道,便于作业者去拾取。

如何用Go语言每分钟处理100万个请求

在网站服务器初始化过程中,我们创建一个Dispatcher,调用Run()去创建一个作业者池,开始侦听出现在JobQueue的作业。

 
 
  1. dispatcher := NewDispatcher(MaxWorker)  
  2. dispatcher.Run() 

下面是用于dispatcher执行的代码:

如何用Go语言每分钟处理100万个请求如何用Go语言每分钟处理100万个请求

注意,我们会提供被实例化和被添加到作业者池的最大的作业者量。 因为我们这个带有dockerized Go环境的项目使用了亚马逊Elasticbeanstalk,我们总是设法遵循12要素方法论来配置生产中的系统,从环境变量中读取这些数值。这样就可以控制有多少作业者和作业队列的最大值,因此,我们可以快速地调整这些值,而不需要重新部署集群。

 
 
  1. var (  
  2. MaxWorker = os.Getenv(“MAX_WORKERS”)  
  3. MaxQueue = os.Getenv(“MAX_QUEUE”)  

在部署完它之后,我们立刻发现所有的延迟率都降到了无关紧要的数字,系统处理请求的能力急剧上升。

如何用Go语言每分钟处理100万个请求

弹性负载均衡完全预热几分钟后,我们看到ElasticBeanstalk应用服务每分钟逼近100万个请求。通常在早晨的几个小时里,流量高峰会超过每分钟100万个请求。

一旦我们部署了新的代码,服务器的数量从100台减少到大约20台。

如何用Go语言每分钟处理100万个请求

在恰当地配置了集群和自动缩放设置以后,我们能够把它降低到仅有4x EC2 c4。如果CPU连续5分钟超过90%,大型实例和弹性自动缩放设置就生成一个新实例。

如何用Go语言每分钟处理100万个请求

结论

简单总是在我的字典里获胜。我们可以设计一个复杂系统,它具有多队列,后台作业者,复杂部署的特点。但是相反我们决定利用Elasticbeanstalk的自动缩放和高效简单的方式去并发,Go语言很好的提供了这些功能。

并不是每天你仅有四台机器的集群,去处理每分钟写入到亚马逊S3 bucket的100万个POST请求,这可能比我最新的MacBook Pro功能强大的多。

总有合适的工具适合这项工作。有时,当您的Ruby on Rails系统需要一个非常强大的web处理程序时,可以稍微考虑一下Ruby生态系统之外的更简单、更强大的替代解决方案。


本文作者:佚名

来源:51CTO

目录
打赏
0
0
0
0
16429
分享
相关文章
监控局域网其他电脑:Go 语言迪杰斯特拉算法的高效应用
在信息化时代,监控局域网成为网络管理与安全防护的关键需求。本文探讨了迪杰斯特拉(Dijkstra)算法在监控局域网中的应用,通过计算最短路径优化数据传输和故障检测。文中提供了使用Go语言实现的代码例程,展示了如何高效地进行网络监控,确保局域网的稳定运行和数据安全。迪杰斯特拉算法能减少传输延迟和带宽消耗,及时发现并处理网络故障,适用于复杂网络环境下的管理和维护。
揭秘 Go 语言中空结构体的强大用法
Go 语言中的空结构体 `struct{}` 不包含任何字段,不占用内存空间。它在实际编程中有多种典型用法:1) 结合 map 实现集合(set)类型;2) 与 channel 搭配用于信号通知;3) 申请超大容量的 Slice 和 Array 以节省内存;4) 作为接口实现时明确表示不关注值。此外,需要注意的是,空结构体作为字段时可能会因内存对齐原因占用额外空间。建议将空结构体放在外层结构体的第一个字段以优化内存使用。
|
2月前
|
Go 语言入门指南:切片
Golang中的切片(Slice)是基于数组的动态序列,支持变长操作。它由指针、长度和容量三部分组成,底层引用一个连续的数组片段。切片提供灵活的增减元素功能,语法形式为`[]T`,其中T为元素类型。相比固定长度的数组,切片更常用,允许动态调整大小,并且多个切片可以共享同一底层数组。通过内置的`make`函数可创建指定长度和容量的切片。需要注意的是,切片不能直接比较,只能与`nil`比较,且空切片的长度为0。
Go 语言入门指南:切片
eino — 基于go语言的大模型应用开发框架(二)
本文介绍了如何使用Eino框架实现一个基本的LLM(大语言模型)应用。Eino中的`ChatModel`接口提供了与不同大模型服务(如OpenAI、Ollama等)交互的统一方式,支持生成完整响应、流式响应和绑定工具等功能。`Generate`方法用于生成完整的模型响应,`Stream`方法以流式方式返回结果,`BindTools`方法为模型绑定工具。此外,还介绍了通过`Option`模式配置模型参数及模板功能,支持基于前端和用户自定义的角色及Prompt。目前主要聚焦于`ChatModel`的`Generate`方法,后续将继续深入学习。
379 7
企业监控软件中 Go 语言哈希表算法的应用研究与分析
在数字化时代,企业监控软件对企业的稳定运营至关重要。哈希表(散列表)作为高效的数据结构,广泛应用于企业监控中,如设备状态管理、数据分类和缓存机制。Go 语言中的 map 实现了哈希表,能快速处理海量监控数据,确保实时准确反映设备状态,提升系统性能,助力企业实现智能化管理。
40 3
eino — 基于go语言的大模型应用开发框架(一)
Eino 是一个受开源社区优秀LLM应用开发框架(如LangChain和LlamaIndex)启发的Go语言框架,强调简洁性、可扩展性和可靠性。它提供了易于复用的组件、强大的编排框架、简洁明了的API、最佳实践集合及实用的DevOps工具,支持快速构建和部署LLM应用。Eino不仅兼容多种模型库(如OpenAI、Ollama、Ark),还提供详细的官方文档和活跃的社区支持,便于开发者上手使用。
356 8
Go 语言中的 Sync.Map 详解:并发安全的 Map 实现
`sync.Map` 是 Go 语言中用于并发安全操作的 Map 实现,适用于读多写少的场景。它通过两个底层 Map(`read` 和 `dirty`)实现读写分离,提供高效的读性能。主要方法包括 `Store`、`Load`、`Delete` 等。在大量写入时性能可能下降,需谨慎选择使用场景。
Go语言实战:错误处理和panic_recover之自定义错误类型
本文深入探讨了Go语言中的错误处理和panic/recover机制,涵盖错误处理的基本概念、自定义错误类型的定义、panic和recover的工作原理及应用场景。通过具体代码示例介绍了如何定义自定义错误类型、检查和处理错误值,并使用panic和recover处理运行时错误。文章还讨论了错误处理在实际开发中的应用,如网络编程、文件操作和并发编程,并推荐了一些学习资源。最后展望了未来Go语言在错误处理方面的优化方向。
阿里双十一背后的Go语言实践:百万QPS网关的设计与实现
解析阿里核心网关如何利用Go协程池、RingBuffer、零拷贝技术支撑亿级流量。 重点分享: ① 如何用gRPC拦截器实现熔断限流; ② Sync.Map在高并发读写中的取舍。
基于 Go 语言的公司内网管理软件哈希表算法深度解析与研究
在数字化办公中,公司内网管理软件通过哈希表算法保障信息安全与高效管理。哈希表基于键值对存储和查找,如用户登录验证、设备信息管理和文件权限控制等场景,Go语言实现的哈希表能快速验证用户信息,提升管理效率,确保网络稳定运行。
35 0

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等