Terway网络场景下的vSwitch扩容

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: Terway网络插件是阿里云容器服务自研的网络插件,使用原生的弹性网卡分配给Pod实现Pod网络。兼顾性能和灵活性,是阿里云容器服务目前阶段、尤其是在大规模集群场景下的首选网络方案。本文讲解如何处理集群使用的vSwitch IP资源不足的问题以及解决办法。

Terway网络插件是阿里云容器服务自研的网络插件,使用原生的弹性网卡分配给Pod实现Pod网络。兼顾性能和灵活性,是阿里云容器服务目前阶段、尤其是在大规模集群场景下的首选网络方案。本文讲解如何处理集群使用的vSwitch IP资源不足的问题以及解决办法。

image

1. vSwitch IP资源不足的特征

如果用户发现Pod创建不出来,状态为ContainerCreating,使用命令

kubectl logs --tail=100 -f terway-eniip-zwjwx -n kube-system -c terway

查看Pod所在节点的terway的日志中,出现如下InvalidVSwitchId.IpNotEnough错误信息:

time="2020-03-17T07:03:40Z" level=warning msg="Assign private ip address failed: Aliyun API Error: RequestId: 2095E971-E473-4BA0-853F-0C41CF52651D Status Code: 403 Code: InvalidVSwitchId.IpNotEnough Message: The specified VSwitch \"vsw-AAA\" has not enough IpAddress., retrying"

说明该节点的terway所使用的vSwitch没有空余IP地址,Pod会因为没有IP资源而一直处于ContainerCreating状态。
如果登录控制台查看该vSwitch的状态,会发现剩余IP数目为0.
image

为了解决这个问题,用户可以手动添加新的vSwitch,增加新的IP地址资源。


2. 添加vSwitch的流程

通过执行如下流程完成添加vSwitch到K8s集群使用。

(1) 在VPC控制台创建新的vSwitch, 注意该vSwitch必须与IP资源不足的vSwitch在一个区域。

因为Pod密度越来越大,建议给Pod使用的vSwitch的网段,网络位小于等于19,也就是网段至少包含8192个IP地址。

(2) 使用如下命令,添加vSwitch到terway的配置ConfigMap中。

kubectl edit cm eni-config -n kube-system

例如添加"vsw-BBB"到vswitches部分,其中vsw-AAA是已经存在的、IP资源不足的vSwitch。

eni_conf: |
{
"version": "1",
"max_pool_size": 25,
"min_pool_size": 10,
"vswitches": {"cn-shanghai-f":["vsw-AAA", "vsw-BBB"]},
"service_cidr": "172.21.0.0/20",
"security_group": "sg-CCC"
}

(3) 如果terway版本不是最新的,需要在组件控制台将terway版本升到最新版本

(4) 如果Step 3中版本已经是最新,跳过该步,继续到下一步;否则,使用如下命令删除全部terway Pod重建。

针对ENI单IP场景执行:

kubectl delete -n kube-system pod -l app=terway-eniip

或者针对ENI单IP场景执行:

kubectl delete -n kube-system pod -l app=terway-eni

然后检查全部terway Pod重建成功。

(5) 创建Pod,验证新创建的Pod可以从新vSwitch成功分配获得IP。


3. 寻求帮助

如果在上述操作中出现异常,请联系客服解决。

目录
相关文章
|
1月前
|
存储 测试技术 C++
P2P网络下分布式文件共享场景的测试
P2P网络下分布式文件共享场景的测试
33 6
|
2月前
|
机器学习/深度学习 数据采集 监控
基于yolov2深度学习网络的车辆检测算法matlab仿真,包括白天场景和夜晚场景
基于yolov2深度学习网络的车辆检测算法matlab仿真,包括白天场景和夜晚场景
|
7月前
|
算法 网络协议 物联网
有线通信网络技术及常用场景(一)
有线通信网络技术及常用场景(一)
195 0
|
4月前
|
监控 测试技术 网络架构
使用云企业网实现跨地域跨VPC的网络互通的场景测评
使用云企业网实现跨地域跨VPC的网络互通的场景测评
365 4
|
6月前
|
域名解析 监控 网络协议
百度搜索:蓝易云【Linux系统有哪些常用的网络命令,分别适用于什么场景?】
这些网络命令在Linux系统中广泛应用于网络管理、故障排除和诊断等场景。通过熟练掌握和使用这些命令,可以更好地管理和监控网络连接,并及时解决网络问题。
193 5
|
7月前
|
物联网 5G 开发者
蜂窝无线网络技术及常用场景(二)
蜂窝无线网络技术及常用场景(二)
178 0
|
7月前
|
物联网 5G 定位技术
蜂窝无线网络技术及常用场景(一)
蜂窝无线网络技术及常用场景(一)
231 0
|
7月前
|
安全 物联网 数据安全/隐私保护
短距无线网络技术及常用场景(三)
短距无线网络技术及常用场景(三)
206 0
|
7月前
|
传感器 安全 物联网
短距无线网络技术及常用场景(二)
短距无线网络技术及常用场景(二)
153 0
|
7月前
|
物联网 5G 网络架构
短距无线网络技术及常用场景(一)
短距无线网络技术及常用场景(一)
176 0