阿里云Kubernetes稳定性最佳实践-阿里云开发者社区

阿里云Kubernetes稳定性最佳实践

2018-06-04 11394

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

容器镜像服务 ACR，镜像仓库100个不限时长

简介： Kubernetes很酷，让我们的机器的资源利用率和运维效率都得到了提升。然而，要想用好Kubernetes，还是有些东西要注意的，否则可能会给自己带来一些小麻烦。在生产环境里，如何保证我们的应用能稳定可靠的运行在Kubernetes里呢？这篇文章将分享在阿里云容器服务上使用Kubernetes的一些有用的tips。

Kubernetes很酷，让我们的机器的资源利用率和运维效率都得到了提升。然而，要想用好Kubernetes，还是有些东西要注意的，否则可能会给自己带来一些小麻烦。在生产环境里，如何保证我们的应用能稳定可靠的运行在Kubernetes里呢？这篇文章将分享在阿里云容器服务上使用Kubernetes的一些有用的tips。

Master节点规格

通过容器服务创建出来的Kubernetes集群，Master节点上运行着etcd、kube-apiserver、kube-controller等核心组件，对于Kubernetes集群的稳定性有着至关重要的影响，对于生产环境的集群，必须慎重选择Master规格。Master规格跟集群规模有关，集群规模越大，所需要的Master规格也越大。当然，这里的“集群规模”是个很抽象的词，我们可以从多个维度衡量Kubernetes集群规模：节点数量/Pod数量/部署频率/访问量……这里简单的认为集群规模就是集群里的节点数量。对于常见的集群规模，可以参考这种如下的方式选择Master节点的规格（对于测试环境，规格可以小一些。下面的选择能尽量保证Master负载维持在一个较低的水平上）：

1-5个节点，Master规格：4C8G(不建议2C4G)
6-20个节点，Master规格：4C16G
21-100个节点，Master规格：8C32G
100-200个节点，Master规格：16C64G

选择合理的磁盘大小

Kubernetes节点需要的磁盘空间也不小，docker镜像、系统日志、应用日志都保存在磁盘上。创建集群的时候，要考虑每个节点上要部署的Pod数量，每个Pod的日志大小、镜像大小、临时数据，再加上一些系统预留的值。

创建出来的ECS，OS占了大约3G多的空间，我们可以给它多留点，算8G。剩下的空间都可以用在Pod上。

使用多可用区

阿里云支持很多Region，每个Region下又有不同的可用区。可用区是指在同一地域内，电力和网络互相独立的物理区域。多可用区能够实现跨地域的容灾能力。当然，响应的会带来额外的网络延时。创建Kubernetes集群时，也可以创建一个包含多个可用区的集群。在容器服务集群创建页面，点击“创建Kubernetes”按钮右边的小三角可以看到。

Screen_Shot_2018_05_31_at_4_51_59_PM

声明每个Pod的resource

我最经常遇到的Kubernetes问题，就是一个节点上调度了太多的Pod，导致节点负载太高，完全没法对外提供服务。怎么避免这种情况出现呢？

在Kubernetes中部署Pod时，你可以指定这个Pod需要的资源，Kubernetes在部署这个Pod的时候，就会根据Pod的需求找一个具有充足空闲资源的节点部署这个Pod。下面的例子中，声明tomcat这个Pod需要0.25核CPU，64M的内存，运行中实际使用不能超过0.5核CPU和128M内存。

apiVersion: v1
kind: Pod
metadata:
  name: tomcat
spec:
  containers:
  - name: tomcat
    image: tomcat
    resources: # 资源声明
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"

Kubernetes采用静态资源调度方式，对于每个节点上的剩余资源，它是这样计算的：节点剩余资源=节点总资源-已经分配出去的资源，并不是实际使用的资源。如果你自己偷偷跑到节点上手工运行一个很耗资源的程序，Kubernetes并不能感知到。

另外所有Pod上都要声明resources。对于没有声明resources的Pod，它被调度到某个节点后，Kubernetes也不会在对应节点上扣掉这个Pod使用的资源。可能会导致节点上调度过去太多的Pod

配置监控

在Pod上配置了resource很大程度了避免了节点堆积太多Pod的问题，然而还不够。我们还可以再加一道保险：配置节点监控。通过添加监控告警规则，节点上的资源使用使用量很高的时候，我们可以知道出问题了。

通过容器服务创建Kubernetes集群时，会自动在云监控创建两个应用分组，一个对应Master节点，一个对应Worker节点。我们可以在这两个组下面添加一些报警规则，对组里所有的机器生效。后续加入的节点，也会自动出现在组里，不用单独再去配置报警规则。

Screen_Shot_2018_05_31_at_6_40_49_PM

主要配置ECS资源的报警规则就可以了。

Screen_Shot_2018_05_31_at_6_49_38_PM

启动时等待下游服务，不要直接退出

应用或多或少都有一些外部依赖，比如需要从db读取数据或者依赖另外一个服务的接口。应用启动的时候，未必外部依赖都能满足，过去手工运维的时候，通常采用依赖不满足立即退出的方式，也就是所谓的failfast，但是在Kubernetes中，这种策略就未必合适了。原因何在？Kubernetes中多数运维操作都是自动的，不需要人工介入，比如部署应用，你不用自己选择节点，再到节点上启动应用，应用挂了，也不用自己跑过去重启，Kubernetes会自动把应用拉起来，负载高了，还可以通过HPA自动扩容。

针对启动时依赖不满足这个场景，假设有两个应用A和B，A依赖B，刚好运行在同一个节点上。这个节点因为某些原因重启了，重启之后，A先被拉起来了，这个时候B还没启动，对A来说就是依赖不满足。如果A还是按照传统的方式直接退出了A，当B启动之后，A也不会再被拉起了，必须人工介入处理才行。

Kubernetes的最好的做法是启动时检查依赖，如果不满足，轮询等待，而不是直接退出。可以通过 Init Container完成这个功能。

配置restart policy

Pod运行过程中进程退出是个很常见的问题，无论是代码里的一个bug，还是占用内存太多被OOM killer干掉，都会导致应用进程退出，Pod挂掉。Pod退出了怎么办？既然用了Kubernetes，就不要再用手工重启这种很low的方式了，只要在Pod上配置restartPolicy，就能实现Pod挂掉之后自动拉起。

apiVersion: v1
kind: Pod
metadata:
  name: tomcat
spec:
  containers:
  - name: tomcat
    image: tomcat
    restartPolicy: OnFailure #

restartPolicy有三个可选值

Always：总是自动重启
OnFailure：异常退出才自动重启（进程退出状态非0）
Never：永远不重启

配置Liveness Probe和Readiness Probe

Pod处于Running状态和Pod能正常提供服务是完全不同的概念，一个Running状态的Pod，里面的进程可能发生了死锁而无法提供服务。但是因为Pod还是Running的，Kubernetes也不会自动重启这个Pod。所以我们要在所有Pod上配置Liveness Probe，探测Pod是否真的存活，是否还能提供服务。如果Liveness Probe发现了问题，Kubernetes会重启Pod。

Readiness Probe用于探测Pod是不是可以对外提供服务了。应用启动过程中需要一些时间完成初始化，在这个过程中是没法对外提供服务的，通过Readiness Probe，我们可以告诉Ingress或者Service能不能把流量转发给这个Pod上。当Pod出现问题的时候，Readiness Probe能避免新流量继续转发给这个Pod。

apiVersion: v1
kind: Pod
metadata:
  name: tomcat
spec:
  containers:
  - name: tomcat
    image: tomcat
    livenessProbe:
      httpGet:
        path: /index.jsp
        port: 8080
      initialDelaySeconds: 3
      periodSeconds: 3
    readinessProbe:
      httpGet:
        path: /index.jsp
        port: 8080

每个进程一个容器

很多刚刚接触容器的人喜欢按照老习惯把容器当虚拟机用，在一个容器里塞入多个进程，监控进程、日志进程、sshd进程、甚至整个Systemd。这种方式有什么问题呢？首先，判断Pod整体的资源占用会变复杂，不方便实施前面提到resource limit。其次，容器内只有一个进程的情况，进程挂了，外面的容器引擎可以清楚的感知到，然后重启容器，如果容器内有多个进程，某个进程挂了，容器未必受影响，外部的容器引擎感知不到容器内进程挂了，也不会对容器做任何操作，但是容器实际上已经不能正常工作了。

如果确实有几个进程需要协同工作，在Kubernetes里也很容易实现，举个例子，nginx和php-fpm，通过unix domain socket通信，我们可以用一个包含两个容器的Pod，unix socket放在两个容器的共享volume中。

确保不存在SPOF

如果应用只有一个实例，当实例挂掉的时候，虽然Kubernetes能够将实例重新拉起，但是中间不可避免的存在一段时间的不可用。甚至更新应用，发布一个新版本的时候，也会出现这种情况。在Kubernetes里，尽量避免直接使用Pod，尽可能使用Deployment/StatefulSet，并且让应用的scale在两个以上。

阿里云Kubernetes稳定性最佳实践

Master节点规格

选择合理的磁盘大小

使用多可用区

声明每个Pod的resource

配置监控

启动时等待下游服务，不要直接退出

配置restart policy

配置Liveness Probe和Readiness Probe

每个进程一个容器

确保不存在SPOF

容器服务

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

阿里云Kubernetes稳定性最佳实践

Master节点规格

选择合理的磁盘大小

使用多可用区

声明每个Pod的resource

配置监控

启动时等待下游服务，不要直接退出

配置restart policy

配置Liveness Probe和Readiness Probe

每个进程一个容器

确保不存在SPOF

容器服务

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

推荐镜像