应用容器化优化指南 - Golang篇

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 前言 随着容器技术的兴起,越来越多不同类型的应用开始使用容器的方式进行交付。Golang作为服务器端非常热门的一门语言同时也是容器技术的主要编写语言备受关注。那么将一个Golang应用进行容器化的时候,需要注意哪些事情,在出现问题时该如何进行调优和诊断呢? 先谈谈Golang本身的设计 Golang是谷歌发布的第二款开源编程语言。

前言

随着容器技术的兴起,越来越多不同类型的应用开始使用容器的方式进行交付。Golang作为服务器端非常热门的一门语言同时也是容器技术的主要编写语言备受关注。那么将一个Golang应用进行容器化的时候,需要注意哪些事情,在出现问题时该如何进行调优和诊断呢?

先谈谈Golang本身的设计

Golang是谷歌发布的第二款开源编程语言。Golang专门针对多处理器系统应用程序的编程进行了优化,使用Golang编译的程序可以媲美C或C++代码的速度,而且更加安全、支持并行进程。Golang在容器相关的场景和领域以及高并发的服务器程序场景下扮演着非常重要的角色。

Golang具有如下三个特点:

  • 简洁 快速 安全
  • 并行 有趣 开源
  • 内存管理 数组安全 编译迅速

在学习一门语言前,通常我会主要关注如下三个方面:第一这门语言的特性是什么;第二这门语言解决的场景和问题是什么;第三这门语言的内部设计是否有需要注意的地方。上面的介绍已经为我们解答了第一个和第二个问题,那么接下来我们主要来讨论第三个问题。那么Golang的这些优秀的特性内部的设计方式是什么样子的,使用起来是否有什么需要特别注意的呢?为了详细解答这个问题,我们将问题拆分成了二个部分分别为大家解答。

  • Golang是如何实现并行的

高并发是Golang被大家接纳和认可的最重要一环。对于大型的互联网项目而言,高并发可以说是应用性能的立足之本,再棒的功能与特性也不如稳定运行来得让人安心。从前大家在关注C10K问题,而现在越来越多的人开始思考如何解决C10M问题。从C10K问题到C10M问题,解决问题的方式已经不是简简单单的调整内核参数那么简单的。更多的是要从架构甚至应用自身的角度来解决,一个高效的并发模型,可以从应用程序的交付压榨系统的性能。目前比较成熟的并发模型,主要是通过进程、线程与协程三种不同方式来进行实现的。

进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量,占据独立的内存,所以上下文进程间的切换开销(栈、寄存器、虚拟内存、文件句柄等)比较大,但相对比较稳定安全。

线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。线程间通信主要通过共享内存,上下文切换很快,资源开销较少,但相比进程不够稳定容易丢失数据。

协程是一种用户态的轻量级线程,协程的调度完全由用户控制。协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快。

Golang的并发模型是基于协程的,而协程在Linux底层的调度是依赖进程的调度的,而这之间的转换都通过Golang自身的调度器进行了管理,无需开发者关心。但是这个时候有经验的开发者就会提出问题了,golang本身是编译型的语言没有类似JVM一样的虚拟机可以在运行时指定参数,那么Goroutine这种方式是否有参数需要设置来保证性能。

此处给大家讲述一个关于Goroutine栈扩容的问题,我们内部有一个全双工的高并发写离线数据的服务,在底层数据出现消费慢的时候快速出现OOM,问题产生的原因就是由于Goroutine栈扩容,最后可以通过通过拆分Goroutine的逻辑到上半段和work group的方式实现,由于篇幅的原因不过多的赘述,可以参考如下这篇博客更深入了解栈扩容的问题。

  • Golang的内存是如何管理的

内存管理对于C++与Java的开发者而言是最熟悉不过的了。C++的开发者必须通过代码手动的申请与释放内存,因此必须熟悉内存布局和使用;Java的开发者虽然有JVM帮助进行内存的管理与回收,但JVM不同的内存参数配置会导致程序因为回收内存带来不同的性能表现。而Golang作为一门高级编程语言,同样无需开发者直接操作内存,但是Golang中的GC设计是存在一些缺欠的。主要的问题在GC时的卡顿上,具体的问题可以参考如下文章,不过这点也无需大家特别关心,建议直接使用Golang1.9以后的版本进行编译即可。深入了解Golang的GC可以参考如下文章

Golang容器化建议

  • 常规容器化建议

首先需要进行的是常规的容器化优化,具体的内容可以参考如下文章进行体积的精简和优化。

  • Golang 中DNS的问题

不同语言对于DNS的Lookup处理会有所不同,在Java或者Node.JS等常见的语言和框架中对DNS Lookup都提供语言级别的内置的Cache,而在Golang中却不存在类似的能力,这会导致对于高并发的场景中,Golang程序有可能会出现大量的DNS查询,而在kubernetes中,DNS是通过内部的coredns或者kube-dns的方式提供的,因此有可能会因为大流量的Golang DNS导致集群异常,为了解决这个问题,建议开发者在Golang的Dockerfile中集成nscd进行DNS的Cache,具体的操作步骤可以参考如下文档

  • Golang 中GC的问题

在本文的上面的部分,为大家讲解了Golang GC的一些缺欠以及如何避免GC问题的方式,在容器化的时候是否还需要做其他的优化呢?面对内存的异常,我们要如何定位是一个GC的问题呢?这里要给大家介绍的是Golang自来的pprof,pprof是Golang语言中内置的性能调优工具,可以协同Flame-Graph,排查CPU性能、内存性能、GC回收等问题,建议在容器的场景中,在代码中集成pprof,并通过环境变量的方式进行开关设置,容器的Dockerfile中保留端口的保留,当出现问题的时候可以设置环境变量的方式进行开启,快速进行线上问题的诊断。pprof的使用,可以参考如下文章

  • Golang 中CGO的问题
    我们知道Golang作为一门编译型的语言,可以通过开启CGO的标签,直接使用C的代码并编译为二级制文件直接使用。但是这种方式非常不建议在容器中开启,特别是使用类似Alpine这种最小镜像的场景下。因为开启CGO的场景下,会动态链接系统的C库,而在Alpine上,很多的目录布局是有所差异的,另外有些最简化的版本glibc的支持并不完善,因此非常不建议使用CGO的方式编译Golang在容器中使用。
  • Golang 中监控的建议
    容器中很多监控的方式都无法很好的直接复用,建议大家使用更Docker的方式来解决,例如使用Prometheus的方式暴露Golang应用内部的指标进行监控,这也是目前非常多Golang开源项目的标配了。使用方式参考下文,与容器服务结合可以参考如下文章
  • Golang 中性能的问题
    Golang与容器的结合通常是为了高性能的场景,那么通常需要对内核参数进行部分的调整,具体的调整方式可以参考如下文章

最后

Golang相对而言算是非常”省心“的一门语言了,在老版本的Golang中还需要通过runtime设置GOMAXPROCS,但是在最新版本的Golang中已经基本无需关心runtime的任何参数设置了,这些参数就像nginx的auto一样,会随着探测的配置自动变化,而在容器中,我们依然需要GOMAXPROCS,因为GOMAXPROCS的识别方式是通过获取系统资源的方式确定的,而在容器中是通过只读挂载宿主机的文件实现的,因此获取的资源还是宿主机的数值。因此,Golang的应用容器化,更多的还是要做好标准镜像优化的步骤,以及在代码级别做好避免触发GC和Goroutine的问题。

目录
相关文章
|
4天前
|
监控 算法 Go
Golang深入浅出之-Go语言中的服务熔断、降级与限流策略
【5月更文挑战第4天】本文探讨了分布式系统中保障稳定性的重要策略:服务熔断、降级和限流。服务熔断通过快速失败和暂停故障服务调用来保护系统;服务降级在压力大时提供有限功能以保持整体可用性;限流控制访问频率,防止过载。文中列举了常见问题、解决方案,并提供了Go语言实现示例。合理应用这些策略能增强系统韧性和可用性。
29 0
|
1天前
|
JavaScript 前端开发 Go
Go语言的入门学习
【4月更文挑战第7天】Go语言,通常称为Golang,是由Google设计并开发的一种编程语言,它于2009年公开发布。Go的设计团队主要包括Robert Griesemer、Rob Pike和Ken Thompson,这三位都是计算机科学和软件工程领域的杰出人物。
9 1
|
1天前
|
Go
|
2天前
|
分布式计算 Java Go
Golang深入浅出之-Go语言中的分布式计算框架Apache Beam
【5月更文挑战第6天】Apache Beam是一个统一的编程模型,适用于批处理和流处理,主要支持Java和Python,但也提供实验性的Go SDK。Go SDK的基本概念包括`PTransform`、`PCollection`和`Pipeline`。在使用中,需注意类型转换、窗口和触发器配置、资源管理和错误处理。尽管Go SDK文档有限,生态系统尚不成熟,且性能可能不高,但它仍为分布式计算提供了可移植的解决方案。通过理解和掌握Beam模型,开发者能编写高效的数据处理程序。
131 1
|
2天前
|
算法 关系型数据库 MySQL
Go语言中的分布式ID生成器设计与实现
【5月更文挑战第6天】本文探讨了Go语言在分布式系统中生成全局唯一ID的策略,包括Twitter的Snowflake算法、UUID和MySQL自增ID。Snowflake算法通过时间戳、节点ID和序列号生成ID,Go实现中需处理时间回拨问题。UUID保证全局唯一,但长度较长。MySQL自增ID依赖数据库,可能造成性能瓶颈。选择策略时需考虑业务需求和并发、时间同步等挑战,以确保系统稳定可靠。
109 0
|
2天前
|
缓存 NoSQL Go
Go语言中的分布式锁实现与选型
【5月更文挑战第6天】本文探讨了Go语言中分布式锁的实现,包括Redis、ZooKeeper和Etcd三种方式,强调了选型时的性能、可靠性和复杂度考量。通过代码示例展示了Redis分布式锁的使用,并提出了避免死锁、公平性等问题的策略。结论指出,开发者应根据业务需求选择合适实现并理解底层原理,以确保系统稳定和高效。
126 0
|
2天前
|
NoSQL 算法 Go
Go语言中的分布式事务处理方案
【5月更文挑战第6天】本文探讨了Go语言在分布式事务处理中的应用,包括2PC、3PC和TCC协议。通过示例展示了如何使用Go的`goroutine`和`channel`实现2PC。同时,文章指出了网络延迟、单点故障、死锁和幂等性等常见问题,并提供了相应的解决策略。此外,还以Redis Redlock为例,展示了如何实现分布式锁。理解并实施这些方案对于构建高可用的分布式系统至关重要。
96 0
|
3天前
|
缓存 测试技术 持续交付
Golang深入浅出之-Go语言中的持续集成与持续部署(CI/CD)
【5月更文挑战第5天】本文介绍了Go语言项目中的CI/CD实践,包括持续集成与持续部署的基础知识,常见问题及解决策略。测试覆盖不足、版本不一致和构建时间过长是主要问题,可通过全面测试、统一依赖管理和利用缓存优化。文中还提供了使用GitHub Actions进行自动化测试和部署的示例,强调了持续优化CI/CD流程以适应项目需求的重要性。
42 1
|
3天前
|
Kubernetes Cloud Native Go
Golang深入浅出之-Go语言中的云原生开发:Kubernetes与Docker
【5月更文挑战第5天】本文探讨了Go语言在云原生开发中的应用,特别是在Kubernetes和Docker中的使用。Docker利用Go语言的性能和跨平台能力编写Dockerfile和构建镜像。Kubernetes,主要由Go语言编写,提供了方便的客户端库与集群交互。文章列举了Dockerfile编写、Kubernetes资源定义和服务发现的常见问题及解决方案,并给出了Go语言构建Docker镜像和与Kubernetes交互的代码示例。通过掌握这些技巧,开发者能更高效地进行云原生应用开发。
40 1
|
3天前
|
负载均衡 监控 Go
Golang深入浅出之-Go语言中的服务网格(Service Mesh)原理与应用
【5月更文挑战第5天】服务网格是处理服务间通信的基础设施层,常由数据平面(代理,如Envoy)和控制平面(管理配置)组成。本文讨论了服务发现、负载均衡和追踪等常见问题及其解决方案,并展示了使用Go语言实现Envoy sidecar配置的例子,强调Go语言在构建服务网格中的优势。服务网格能提升微服务的管理和可观测性,正确应对问题能构建更健壮的分布式系统。
25 1