K8S从懵圈到熟练:读懂这一篇,集群节点不下线

  1. 云栖社区>
  2. 阿里云支持与服务>
  3. 博客>
  4. 正文

K8S从懵圈到熟练:读懂这一篇,集群节点不下线

shengdong 2019-04-21 20:50:36 浏览3097
展开阅读全文

排查完全陌生的问题,完全不熟悉的系统组件,是售后工程师的一大工作乐趣,当然也是挑战。今天借这篇文章,跟大家分析一例这样的问题。排查过程中,需要理解一些自己完全陌生的组件,比如systemd和dbus。但是排查问题的思路和方法基本上还是可以复用了,希望对大家有所帮助。

问题一直在发生

I'm NotReady

阿里云有自己的Kubernetes容器集群产品。随着Kubernetes集群出货量的剧增,线上用户零星的发现,集群会非常低概率地出现节点NotReady情况。据我们观察,这个问题差不多每个月,就会有一两个客户遇到。在节点NotReady之后,集群Master没有办法对这个节点做任何控制,比如下发新的Pod,再比如抓取节点上正在运行Pod的实时信息。

需要知道的Kubernetes知识

这里我稍微补充一点Kubernetes集群的基本知识

网友评论

作者关闭了评论
shengdong
+ 关注
所属云栖号: 阿里云支持与服务