基于KVM的H3C云计算平台CAS的一些运维经验

简介: 前言 在写本文时,CAS版本为3.0 (E0306H23),虚拟机操作系统主要以CentOS Linux 7.2.1511Minimal为主,有少部分Windows Server 2008 R2(包括标准版和企业版)、Windows Server 2003(包括标准版和企业版)、CentOS7.3、CentOS7.4、CentOS6.X。

前言

在写本文时,CAS版本为3.0 (E0306H23),虚拟机操作系统主要以CentOS Linux 7.2.1511Minimal为主,有少部分Windows Server 2008 R2(包括标准版和企业版)、Windows Server 2003(包括标准版和企业版)、CentOS7.3、CentOS7.4、CentOS6.X。

一、资源调整

(一)CPU

1.虚拟机在运行时,CPU的核数是不能进行调整的,只能调整CPU的个数。并且,个数只能增加不能减少。大部分虚拟机支持CPU个数热添加,有少部分虚拟增加CPU资源之后机需要重启。CentOS7.2-1511系统CPU资源在线添加之后立即生效。

2.CPU核心总数=CPU个数*每个CPU的核心数,CAS的CPU核心数是指每个CPU的核心数。

3.CAS平台的CPU是可以超额分配的。一般情况下,不需要绑定物理CPU。

(二)内存

1.在修改内存时我们会看到:“若虚拟机处于运行或者暂停状态,修改内存预留后,必须重启虚拟机才能生效,且修改后的内存值必须大于原内存大小”。实际在操作过程中是这样的,对于在线的虚拟机,增加虚拟机内存后是实时生效的,不能在线减少内存。如需减少内存资源配置,那就需要关闭虚拟机修改数值之后,再次启动。

2.虚拟机一般情况下内存不设预留值。

3.CAS的内存不能超配。如果CAS系统开启了系统预留内存,那么就必须保证至少剩余宿主机总内存的10%左右的预留值。主机内存预留值不足的情况下虚拟机是无法正常启动的,遇到紧急情况,可以暂时关闭CAS系统的主机内存预留,一小段时间后,启动虚拟机之后再开启主机内存预留。

(三)磁盘

1.关于磁盘的修改,系统提示:若虚拟机处于运行或者暂停状态,修改缓存方式、存储大小(对于支持Virtio磁盘在线扩容的虚拟机操作系统,Virtio磁盘在线扩容后无需重启虚拟机)、限制I/O速率(读/写)、限制IOPS(读/写)后,必须重启虚拟机才能生效 。由于新建虚拟机时一般都采用高速智能硬盘,因此是可以在线增加磁盘容量,无需重启系统的。

2.磁盘容量只能增加,不能减少,每次操作的时候需要谨慎考虑,不要过分浪费资源。

3.对于一些P2V、V2V迁移过来的虚拟机,有些硬盘接口需要特别考虑。

4.在CAS平台增加磁盘资源后,需要回到虚拟机操作系统对新分配的磁盘资源进行分区、挂载、LVM操作。目前一般使用LVM对磁盘进行管理,如遇特殊情况还需特别处理。

(四)网络

1.虚拟机创建时就要注意选择正确的虚拟交换机、网络策略模板。

2.一些特殊的网卡设备,还需对应型号进行设置。

3.如果是克隆过来的虚拟机,那么需要特别注意MAC地址。MAC地址出现冲突时,关闭虚拟机,更新MAC地址后再次启动虚拟机操作系统,系统启动后检查其他网络配置。其他网络配置无误,网络依然不通,则需要找出多余的网卡网络配置,删除或者更新配置文件内容,偶尔还需要手动更新MAC地址。此部分可以使用NetworkManager来进行操作。

4.虽然NetworkManager已经厂商设置开机启动,但是该工具并不能正常开机启动,使用NetworkManager时,必须先启动再使用。这一部分最常用的的命令为:mntui,网络配置、主机名修改等都非常有用。

二、运维要点

1、如果CVM进行过更改,那么更改完成之后第一件最重要的事是要检查CVM上的NTP服务,查看配置文件,时钟源配置是否正确,同步是否正常。CVM的DNS也是必须配置的项目,配置完成以后务必检查是否生效。CVM的状态、NTP服务、CVM的DNS解析是日常重点监控的对象,需要格外注意!

2.把CAS的CVM设置成主NTP。

3.虚拟机创建完成后,第一件事是卸载虚拟机自带的NTP软件,CentOS7.2无需操作,CentOS7.4自带了chrony的NTP服务软件,需要卸载,卸载完成安装CAStools后开启时间同步。由于CentOS7.3是奇数版本,日常较少使用,此处需要综合CentOS7.2和CentOS7.4进行考虑。Windows系统同样,关闭NTP同步,安装CAStools,开启时间同步。

4.对于新安装的CVK主机,安装完之后第一件事是对系统进行升级,必须保持版本与CVM一致,升级完毕之后才能将CVK主机增加到CAS平台被CVM管理。

5.为了降低物理主机宕机、重启造成的影响,需要在虚拟机上设置“主机启动后,自动启动虚拟机”,具体操作步骤为:修改虚拟机->更多->引导设备-自动启动-是。

6.CVK、CVM的安装过程中,需要主要的是,磁盘分区选择整块硬盘LVM管理,以便后期扩展磁盘空间。

7.CAS平台的虚拟机迁移不支持无中断业务迁移模式,在线迁移会造成虚拟机状态暂停,迁移完成之后部分服务可能需要重启。迁移都会造成业务中断,需要特别注意。但是可以采取克隆、切换业务的方式来减低业务中断带来的风险,需要具体情况具体分析。

8.CentOS7.4自带了firewalld防火墙,并且厂商预置状态为开机自动启动,很多时候端口不通的原因就来源于此,日常运维中注意即可。

9.Windows Server 2008 R2标准版增加内存需要关闭主机。常规的在虚拟机操作系统内关机的方式并未结束CVK上的相关虚拟机的进程,需要使用系统的关机菜单进行关机之后,修改内存重启,这样,新增的内存才能被系统正常使用。具体流程为:关闭(CAS主控制面板)->修改内存->启动虚拟机,企业版则不需要如此操作,增加后直接生效。

10.CVM配置文件的备份。这是一个很重要的操作,原则上每周至少备份一次,并且需要注意保持异机备份。每次版本升级之前必须进行备份,并且将备份文件保存到CAS系统以外的存储上。养成每次版本升级后系统确认无误后第一时间备份配置文件的习惯。

11.在虚拟机迁移之前需要在目标主机配置好虚拟交换机网络配置。如果使用网卡聚合功能,则需要提前在对应的网卡上进行相关的网络配置操作。

三、总结

1.本文是在本人运维H3C的CAS平台半年以后总结出来的经验,本着对自己或读者负责的态度,在写作本文时又进行了再次验证,但疏漏之处无法避免,希望诸位发现问题后第一时间告知本人,本人会在第一时间内完成验证并更正。

2.由于截图太浪费时间,本文无截图,敬请谅解。因为我是这样觉得的:能点进此文来的朋友应该都比较熟悉CAS云计算平台,很多地方只需点到为止即可,希望也给读者朋友带来思考质疑的空间,这样利于大家一起进步。

3.由于时间仓促,暂且写到此处,以后发现新内容再次更新。能力有限,疏漏之处,万望指出,感谢!

相关文章
|
3月前
|
存储 人工智能 大数据
云计算平台:AWS、Azure和Google Cloud的比较与选择
在当今数字化时代,云计算平台成为了企业和个人的首选。本文将重点比较三大主流云计算平台:AWS、Azure和Google Cloud,从性能、功能、可用性以及定价等方面进行综合评估,帮助读者更好地选择适合自己需求的云计算平台。
|
3月前
|
机器学习/深度学习 存储 人工智能
云计算平台选择之路:AWS、Azure和Google Cloud的比较与抉择
在当今数字化时代,云计算平台扮演着企业转型和创新的关键角色。本文将对三大主流云计算平台——AWS、Azure和Google Cloud进行比较分析,为读者提供选择指南。我们将从性能、可靠性、生态系统、服务和定价等方面综合评估,以帮助读者做出最适合他们业务需求的决策。
101 0
|
4月前
|
Kubernetes 监控 云计算
Docker与云计算平台集成:AWS、Azure、GCP完全指南
Docker和云计算平台的结合,如AWS(Amazon Web Services)、Azure(Microsoft Azure)和GCP(Google Cloud Platform),为现代应用的构建和部署提供了巨大的便利性。本文将深入研究如何与这些主要云计算平台集成Docker,提供更多示例代码和详细指南,帮助大家更全面地利用这些强大的工具。
|
6月前
|
运维 监控 Linux
云计算运维工程师简历怎么写?带简历案例
云计算运维工程师简历怎么写?带简历案例
546 0
|
6月前
|
存储 云安全 大数据
【云计算和大数据平台】云计算平台和大数据平台(如阿里云、腾讯云、华为云等)的搭建和使用方法
【云计算和大数据平台】云计算平台和大数据平台(如阿里云、腾讯云、华为云等)的搭建和使用方法
227 0
|
1月前
|
边缘计算 Cloud Native 安全
未来云计算平台的发展趋势与挑战
随着数字化时代的到来,云计算作为一种关键的信息技术基础设施正在发挥着越来越重要的作用。本文将探讨未来云计算平台的发展趋势与面临的挑战,分析在日益复杂多变的技术环境下,云原生技术的应用将如何推动云计算平台迈向新的高度。
|
28天前
|
机器学习/深度学习 人工智能 运维
未来智能运维:人工智能在云计算运维中的应用
随着云计算技术的不断发展,传统的运维方式已经无法满足日益复杂的系统需求。本文探讨了人工智能在云计算运维中的应用,介绍了未来智能运维的发展趋势和挑战。
16 3
|
1月前
|
人工智能 安全 物联网
在云计算时代,各种云服务和平台为我们提供了无限的机遇和挑战
【2月更文挑战第33天】在云计算时代,各种云服务和平台为我们提供了无限的机遇和挑战
21 7
|
1月前
|
边缘计算 Cloud Native 安全
未来云计算平台的发展趋势与挑战
随着数字化转型的加速推进,云计算平台正成为企业和个人数字化业务的重要基础设施。本文将探讨未来云计算平台的发展趋势及面临的挑战,从多维度分析云原生、边缘计算、安全性以及可持续性等方面,展望未来云计算平台的发展方向。
|
1月前
|
弹性计算 运维 负载均衡
云计算运维常见名词解释
南北向接口、反亲和、公网IP和内网IP、脑裂、冷热迁移、去堆叠
60 2