ECS主动运维2.0,体验升级,事半功倍

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
简介: 阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。基于主动运维2.0,您使用ECS云服务器的体验更加流畅,而且利用系统事件,不再依赖于工单联系客服,可以通过自助处理的方式响应主动运维实例重启,减少对系统可靠性和业务连续性的影响。

      云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。当您基于ECS云服务器搭建了业务系统,借助云计算的诸多优势和特性,可以实现对业务需求的敏捷响应和对业务连续性的有力保障。在此基础上,阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。


主动运维

      阿里云使用严格的IDC标准、服务器准入标准以及运维标准,保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器的高可用性。对于单台ECS实例, 阿里云承诺一个服务周期内单台ECS实例的服务可用性不低于99.95%;对于单地域多可用区,阿里云承诺一个服务周期内该单地域多可用区的服务可用性不低于99.99%。

      我们知道,在基础设施层面,始终存在一些潜在因素如软件bug或硬件故障等会影响ECS实例的运行,因此为了保证上述高级别的服务可用性,除了云计算基础框架的高可用性设计以外,ECS主动运维不可或缺。主动运维作为ECS的隐形卫士,会主动对承载ECS实例运行的物理服务器做日常维护和故障检测,并尽可能通过在线或轮转升级的方式修复潜在的故障隐患,以持续提升系统可靠性、性能和安全防护能力,保障云服务器稳定运行。

      但对于某些情况,物理服务器需要重启或停机维护,这时主动运维系统会向该服务器上的ECS用户发送消息通知,提示您的ECS实例需要重启迁移至健康的物理服务器之上。此前,用户接到这样的通知后需要提交工单联系客服人员授权处理,随着主动运维2.0的进化,这方面的体验得到多方面的提升。


体验升级

1. 主动运维热迁移,实例运行不中断

      当主动运维检测到物理服务器存在故障风险时,系统会优先尝试将该服务器上的ECS实例在线热迁移至其他物理服务器,热迁移成功的实例不会中断运行,其业务可以保持在线;只有少量热迁移存在风险的实例才会进入主动运维重启迁移流程。此策略升级后,有效减少对用户业务连续性的冲击,在阿里云用户规模快速增长的情况下,主动运维相关工单数量同比下降125倍!

2. 风险提示更清晰,迁移影响提前知
      对于有必要进行重启迁移的实例,阿里云会提前向用户发送消息通知和针对性的提示。由于本地存储(本地盘)来自单台物理服务器,不基于多副本分布式技术,在迁移时本地盘所存储数据会被擦除,因此对于本地盘实例,通知中明确提示该风险并提醒您在迁移前及时备份数据。对于云盘实例,通知中提供操作引导,您不再需要提交工单联系客服人员,可以直接在控制台或通过API处理实例重启迁移。

3. 不用工单找客服,系统事件来帮忙
      云盘实例重启迁移的自助处理功能在控制台和API上线,当您受到重启迁移的系统计划事件时,可以知晓该事件的执行计划。如下图所示,根据您的业务需要,可以选择立即执行重启、预约在业务低峰期执行重启、或等待系统按计划执行,做有准备的运维操作。这样的过程不再需要依赖工单处理,提高效率的同时减少实例重启对您在行业务的冲击。
036785e95a5685c8d18c6f7a23dc9b7a8de702ee
08b9688d01c10cc3e8fe2b8d388fc77e4762d8bc


事半功倍

      正如上面提到的体验改进,“事”半功倍,除了主动运维流程进化,还来源于系统事件的发布。系统事件有利于提升用户对于ECS运行状态变化的感知,并进行有针对性的操作来响应或规避事件对在行业务的影响。通过系统事件的闭环,将更多的运维场景标准化、自动化,让用户获得更好的额云上运维体验。


玩转系统事件,更多信息可参考

相关实践学习
快速体验PolarDB开源数据库
本实验环境已内置PostgreSQL数据库以及PolarDB开源数据库:PolarDB PostgreSQL版和PolarDB分布式版,支持一键拉起使用,方便各位开发者学习使用。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
践远
+关注
目录
打赏
0
1
0
0
119
分享
相关文章
摆脱繁琐命令-让运维更加流畅-阿里云ECS操作系统控制台运维篇
阿里云操作系统控制台提供了便捷的服务器监控与管理功能,简化了运维工作。通过将多台服务器纳入统一监控平台,用户可以快速查看CPU、内存、磁盘和网络等关键资源的使用情况,避免了逐一远程连接查询的繁琐操作。此外,该工具支持自动化数据汇总,极大地方便了日报、周报和月报的编写。测试过程中,系统展示了良好的稳定性和响应速度,尤其在网络抖动和大文件健康状态测试中表现出色。整体体验流畅,显著提升了运维效率。 操作系统控制台地址:[点击访问](https://alinux.console.aliyun.com/)
75 26
摆脱繁琐命令-让运维更加流畅-阿里云ECS操作系统控制台运维篇
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
75 14
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS自动化部署。支持Ubuntu 22.04/20.04、CentOS 7.7-7.9及Alibaba Cloud Linux 3.2104 LTS。前提条件:ECS实例需运行中且有公网。步骤:选择Docker扩展并安装,验证成功通过命令`docker -v`查看版本号。
406 79
GitHub 热门开源运维工具 Websoft9:如何实现服务器管理效率翻倍?
Websoft9 提供 200+ 开源应用一键部署,支持容器化隔离、GitOps 自动化和企业级安全防护,助力服务器管理效率提升 80%。
61 1
基于AI的自动化服务器管理:解锁运维的未来
基于AI的自动化服务器管理:解锁运维的未来
117 0
|
3月前
|
阿里云服务器批量执行命令(系统运维管理oos)
阿里云【系统运维管理oos】批量执行详情
85 5
使用阿里云服务器自动搭建WordPress网站流程,超简单by系统运维管理OOS
本教程介绍如何使用阿里云服务器(ECS)和系统运维管理OOS自动搭建WordPress网站,支持Ubuntu、CentOS及Alibaba Cloud Linux等操作系统。前提条件包括ECS实例处于运行中、有公网IP且安全组已开启80端口。安装步骤简单:进入ECS快速购买控制台选择预装WordPress,确认下单后通过管理控制台查看实例详情并开放安全组端口。最后,通过实例公网IP访问,出现WordPress登录页即表示安装成功。
自动化运维:使用Ansible实现批量服务器配置
在快速迭代的IT环境中,高效、可靠的服务器管理变得至关重要。本文将介绍如何使用Ansible这一强大的自动化工具,来简化和加速批量服务器配置过程。我们将从基础开始,逐步深入到更复杂的应用场景,确保即使是新手也能跟上节奏。文章将不包含代码示例,而是通过清晰的步骤和逻辑结构,引导读者理解自动化运维的核心概念及其在实际操作中的应用。
自动化运维:使用Ansible进行服务器配置管理
在现代IT架构中,自动化运维已成为提升效率、减少人为错误的关键。本文将介绍如何使用Ansible这一强大的自动化工具来简化和标准化服务器的配置管理过程。通过具体的代码示例和操作步骤,我们将展示如何快速部署应用、管理配置以及自动化日常任务,从而确保环境的一致性和可靠性。
HTTPS 证书自动化运维:https证书管理系统- 自动化监控
本文介绍如何设置和查看域名或证书监控。步骤1:根据证书状态选择新增域名或证书监控,线上部署推荐域名监控,未部署选择证书监控。步骤2:查询监控记录详情。步骤3:在详情页查看每日定时检测结果或手动测试。
HTTPS 证书自动化运维:https证书管理系统- 自动化监控

相关产品

  • 云服务器 ECS