筑一座五军集结的长城:保障运维世界

简介:
c46a21b0852b286a6f8a58351e5f961ea2f94f5c

近期,张艺谋导演执导的电影《长城》在国内火热上映,且不说电影中的故事设定和剧情如何,屹立于山巅上的万里长城和觊觎于长城外的无餍饕餮却着实令人震撼。笔者不禁思考:在我们运维领域,不也存在这样一群“饕餮”吗?它们时而神出鬼没,导致系统故障,却又难以定位;时而无影无形,在平静下暗藏隐患;时而兵临城下,集中式爆发,导致业务崩溃。

运维,我们也需要这样一座“长城”,集结“鹤、鹰、虎、熊、鹿”五军,共同抵御和消灭随时到来的“饕餮”。优云Automation正是这样一道不断完善的大型“工事”,集结各方军队,共同为运维世界筑起坚实的长城,快捷自动地解决运维工作中出现的问题,让运维世界里的我们过上幸福祥和的日子。

鹤军——信息总览界面

鹤军,如鹤般优雅灵动,俯视全局。Automation的总览界面能够让我们轻松地了解全局,能查看所有被管主机、服务和编排的数量,可了解最近24小时作业执行汇总、最近30天的作业执行情况等,能够直观了解运维全局。拥有“鹤军”,我们就能够统领全局。

4e2040879f0082663b61989111beeda5ca846044

我们可以点击具体的状态分类(如“执行成功”),或者某次具体的作业,了解作业的详细执行过程和结果,从而做进一步的判断和处理。

abd9d787e09295c7128a5ce68b84b14c655ab6bf

鹰军——巡检和故障自愈

鹰军,目光如鹰般敏锐,时刻提防远处的敌人。Automation内置系统巡检和故障自愈功能,恰如苍鹰一般时时刻刻扫描可能出现的指标异常、运行崩溃、未按预期工作等突发状况,进行预定策略自动修复。

在巡检方面,Automation内置了常见的巡检项,也可以根据需求编写更多巡检操作。然后将这些操作任意组合,形成一个巡检编排,就可以对大批量的主机进行定期检查。每当巡检完成后,可以自动生成一份报告,发送给指定人员。

3c0cf2ff2a66e954d5b9622d2bad1da8660302a7

故障自愈方面,可以定期监控某对象(比如MySQL数据库)运行状态、指标的脚本,当发现结果异常的时候调用对应的操作进行处理,从而达到故障自愈的目的。

f4b038a2af957feb813075089f219e2dde3dea69

拥有“鹰军”,我们就能够及时发现并处理突发情况。

虎军——强大的操作和编排

虎军,如猛虎一般,掌握长城内务的重型机关。Automation内置种类丰富的操作和编排,并提供包括Python、Shell、VBS、Bat在内的多种脚本语言支持,可利用这些脚本语言自由扩展运维操作。

内置丰富的操作:

27b786692bf5d8baecdd1af95b8d4c527387071a

自定义扩展操作:

42d5cf419801449d8c0178b1300bc38837953d2b

每位运维工程师都可能会有“独家脚本”,正是依靠着它们实现了日常运维的需求,比如说软件的装卸、服务启停、系统检查等。然而这些脚本可能只能解决某个单一的问题,无法适用于复杂的运维场景,没能发挥出这些“士兵”的最大价值。Automation提供可视化的编辑能力,能将这些“士兵”编排起来形成强大的阵法,真正发挥出“虎军”的强大威力。拥有“虎军”,我们就能够游刃有余地应对各类需求。

f88be4fec2a41b994a1d1247bab890a2d317edfc

熊军——开放简洁的API

熊军,短兵相见,以身相搏。Automation的OpenAPI体系提供非常便捷的集成能力,OpenAPI基于RESTful协议提供,支持任意技术集成。这样我们可以在特定的主机上运行其他业务程序,当需要实现自动操作时,比如创建虚拟机、部署应用、创建账号等,便可利用我们的利刃—OpenAPI来完成使命。拥有“熊军”,我们不再惧怕强大的“怪兽”可以联合起具有各种特殊能力的友军,勇往直前。

3ac68c2727b3079dc6c36774a49d9386565df29e

鹿军——底层通信和消息通知

鹿军,禁军中的骑兵,速度是其利刃。Automation底层基于高效的消息队列实现,能够在数秒内完成单台Proxy与数千台Agent的即时通信(比如说指令的下发、结果的返回等),从而保证操作任务和文件的即时执行或下发,让管理成千上万台主机变得像管理单台主机一样轻松方便。

在作业执行失败,异或巡检或监控指标异常的时候,能够通过站内信、邮件、短信、社交工具等多种方式及时地通知相关负责人,从而使得及时处理成为可能。拥有“鹿军”,我们便能够快速执行,并能及时发现问题,及时处理。

7fb80b07c2f739534794ec2bb7e8db8e74bbc790

在运维的世界中,有了优云Automation,即便一波又一波凶猛的“饕餮”来袭,我们也能够集结“五军”之力将之消灭。借助“鹤军”了解概况、综合分析,借助“鹰军”全面巡检、防患未然;借助“虎军”快速操作、批量作业;借助“熊军”灵活调度;借助“鹿军”提高效率、及时获取最新消息。未来Automation也会加入更多的军种,比如灵活便捷的编排DSL、插件化Agent体系等,共同抵御随时到来的“饕餮”!

优云全线产品免费试用:https://www.uyun.cn

相关文章
|
5月前
|
运维 监控 安全
云时代,如何保障运维安全?
运维是一个非常广泛的定义,在不同的用户不同的阶段有着不同的职责与定位。在初创公司,运维工程师的工作可能需要从申请域名开始,购买或租用服务器,上架,调整网络设备的设置,部署操作系统和运行环境,部署代码,设计和部署监控,防止漏洞和攻击等等。
106 0
云时代,如何保障运维安全?
|
11月前
|
运维 监控 负载均衡
《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.1 制定SRE黄金准则
《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.1 制定SRE黄金准则
94 0
|
11月前
|
运维
《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.2 游戏自动化运维体系构成
《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.2 游戏自动化运维体系构成
104 0
|
11月前
|
弹性计算 运维 Shell
《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.3游戏部署的自动化实践
《泛娱乐行业技术服务白皮书》——四、泛娱乐业务保障与调优最佳实践——4.1游戏运维SRE实践——4.1.3游戏部署的自动化实践
137 0
|
11月前
|
存储 运维 容灾
《医保行业容灾演练云上技术白皮书》——第三章 医保云容灾建设方案——3.4 云平台建设保障与运维要求
《医保行业容灾演练云上技术白皮书》——第三章 医保云容灾建设方案——3.4 云平台建设保障与运维要求
100 0
|
机器学习/深度学习 运维 监控
无人值守时代,运维如何保障发布质量?
阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。
4811 0
|
运维 开发者
SRE技术保障平台-盯屏中心TAC: 混合云一站式告警运维平台
SRE技术保障平台-盯屏中心TAC: 混合云一站式告警运维平台
SRE技术保障平台-盯屏中心TAC: 混合云一站式告警运维平台
|
7月前
|
缓存 运维 Linux
Linux(CentOS)运维脚本工具集合
Linux(CentOS)运维脚本工具集合
148 2
|
21天前
|
运维 Linux Shell
linux运维常用命令
linux运维常用命令