函数计算进行自动化运维专题

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介:

前言

通常来说,自动化运维有两种类型的运维方式:

  • 定时的脚本任务, 比如定时更换云服务的 acess key secret , 定时检查 ecs 对外暴露的端口等
  • 报警事件的紧急处理, 比如 ecs 实例发生异常重启

在传统的运维中,对于定时任务的处理通常用crontab脚本来实现,但是一旦管理的机器多了,必定会对脚本进行集中管理,这个时候对集中管理脚本的机器的可用性、脚本里面会散落密码明文等相关信息以及定时任务执行的记录都是一个很大的挑战;而对于事件驱动的报警处理,要么是通过短信报警告知运维人员,要么需要自建服务来处理报警信息, 无论是哪种方式,财务成本和运维成本都很大。本文探讨一种新的运维方式,利用函数计算做自动化运维,以极低的成本就可以获得一个高可靠,高质量的运维服务。

函数计算

阿里云函数计算是一个事件驱动的serverless计算服务。通过函数计算,您无需管理服务器等基础设施,只需编写代码并上传。函数计算会为您准备好计算资源,以弹性、可靠的方式运行您的代码,具体表现为:

  • 无需采购和管理服务器等基础设施
  • 按需付费,比如对运维管控这类低频调用的系统,财务成本通常能节约90%以上
  • 专注业务逻辑的开发,能极大提高开发效率,比如十分钟上线弹性高可用的图片处理服务
  • 稳定高可用,毫秒级别弹性伸缩,快速实现底层扩容以应对峰值压力
  • 提供日志查询、性能监控、报警等功能快速排查故障

函数计算遇见自动化运维

函数计算给用户极大的自由来实现自定义的功能,一旦和自定义自动化运维相遇,会擦出不一样的火花。下面就本文就传统的自动化运维和函数计算进行自动运维在两种不同类型维度上做一个对比:
_

定时任务示例场景分析

定时任务示例场景1

某些云服务账号acess key secret需要定期更换,以确保 acess key secret安全

定时任务示例场景2

定期检查自己 ecs 对应暴露的端口,确保安全。比如你的ecs是一个网站服务器,可能只需要对外暴露 80 端口就行,如果出现 0.0.0.0/0 这种允许所有人访问的漏洞,需要出现报警或者自动修复。

函数计算自动化运维实战1 -- 定时任务

事件驱动示例场景分析

事件驱动示例场景1

假设两台 ECS 机器 A, B, A 机器出现了宕机,这个时候需要把A机器上的 eip 迁移到备用机器 B 上,可利用云监控的报警和函数计算可以实现 eip 的自动迁移, 云监控检测到A宕机这个事件,然后触发函数执行,函数实现 eip 的自动迁移。

函数计算自动化运维实战2 -- 事件触发 eip 自动转移

事件驱动示例场景2

假设之前一台 ecs 发生系统错误而重启,用户可能会紧急起来做一些验证或者创建快照的处理, 在下面的实战中,我们对一台因为系统错误实例重启或者因实例错误而重启的机器进行自动化处理,比如成功重启后创建快照处理。

函数计算自动化运维实战3 -- 事件触发自动创建快照

总结

用函数计算进行自动化运维,对进行自动化运维处理的函数进行可视化的管理、监控,函数的运行具有弹性,高可用,安全性高等有点;同时在驱动函数的事件源上,云监控提供了丰富事件,并且事件还在不断丰富中(云产品系统事件监控),丰富的事件触发自定义处理的函数,高可用的定时器,这些都可以保证我们可以实现更加完美的的自动化运维。
如果对函数计算进行自动化运维这个运用场景感兴趣, 请点击收藏本页,我们会在这边函数计算进行自动化运维这个专题主页持续更新相关内容和实战案例。

相关实践学习
基于函数计算一键部署掌上游戏机
本场景介绍如何使用阿里云计算服务命令快速搭建一个掌上游戏机。
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
29天前
|
运维 Prometheus 监控
构建高效自动化运维系统的关键策略
【2月更文挑战第30天】随着云计算和微服务架构的兴起,现代IT运维环境变得愈加复杂多变。为保持业务连续性、提高响应速度并降低成本,企业亟需构建一个高效的自动化运维系统。本文将深入探讨自动化运维系统构建过程中的关键策略,包括工具和技术选型、流程优化、监控与告警体系搭建以及持续集成/持续部署(CI/CD)实践,旨在为读者提供一个清晰的构建蓝图和实用的实施建议。
|
5天前
|
人工智能 运维 监控
构建高效自动化运维体系的实践与思考
【4月更文挑战第14天】在数字化转型的浪潮中,自动化运维作为提升系统稳定性和效率的关键手段,受到了企业的广泛关注。本文将深入探讨如何构建一个高效的自动化运维体系,涵盖从基础设施的搭建到流程的优化等多个方面。通过分析当前自动化运维的挑战及解决方案,文章旨在为读者提供一套实用的策略框架,帮助企业实现运维工作的高效化、标准化和智能化。
|
6天前
|
运维 Prometheus 监控
构建高效自动化运维流程的策略与实践
【4月更文挑战第13天】 在现代IT基础设施管理中,自动化运维已成为提升效率、确保稳定性和快速响应变化的关键因素。本文将详细探讨构建一个高效自动化运维流程的战略规划、关键技术选型以及实际执行过程中的最佳实践。我们将通过具体案例分析,展示如何整合配置管理工具、持续集成/持续部署(CI/CD)管道、监控告警系统以及日志分析平台,来形成一个协同工作的整体解决方案。文章的目标是帮助运维团队构建出能够适应不断变化需求的自动化框架,实现运维工作的标准化、系统化和智能化。
|
14天前
|
人工智能 运维 监控
构建高效自动化运维体系:策略与实践
【4月更文挑战第5天】在数字化转型的浪潮中,企业IT基础设施变得日益复杂多变。为保持竞争力,组织需转向高效自动化运维,以提升响应速度和服务质量。本文将探讨构建自动化运维体系的关键环节,包括工作流程自动化、监控预警、以及持续集成/持续部署(CI/CD)的实施策略。通过分析真实案例,揭示如何利用现代技术实现运维效率的最大化,同时确保系统的稳定性与安全性。
|
25天前
|
运维 Prometheus 监控
构建高效稳定的云基础设施:自动化运维策略与实践
在动态的云计算环境中,自动化运维(AIOps)已成为确保服务稳定性和效率的关键。本文将深入探讨构建高效稳定云基础设施的策略,重点关注自动化工具的选择、配置管理的最佳实践、持续集成与持续部署(CI/CD)流程的优化,以及监控和日志分析的重要性。通过这些策略的实施,企业能够减少人为错误,提高响应速度,并最终实现运维效率的显著提升。
|
29天前
|
运维 监控 持续交付
构建高效自动化运维体系的实践之路
【2月更文挑战第30天】随着信息技术的飞速发展,企业对于运维服务的要求越来越高。本文将深入探讨如何构建一套高效的自动化运维体系,包括监控、部署、日志管理以及故障响应等方面。文章首先分析了当前自动化运维的必要性和挑战,随后提出了基于容器化技术、微服务架构和DevOps理念的解决方案框架,并通过实际案例展示了实施该体系的详细步骤与成效评估。本研究的目标是为运维团队提供一套可行的方法论,以提升系统稳定性和运维效率。
|
29天前
|
机器学习/深度学习 人工智能 运维
构建高效自动化运维体系的探索与实践
【2月更文挑战第30天】 在信息技术迅猛发展的今天,企业对于IT系统的依赖日益加深。随之而来的是运维工作的复杂性和难度不断上升,传统的手动运维模式已经难以满足快速响应和高效率的需求。本文旨在探讨如何构建一个高效的自动化运维体系,以提升系统稳定性、降低人为错误并优化资源配置。文中将详细介绍自动化运维的核心组件,包括配置管理、持续集成与持续部署(CI/CD)、监控告警以及故障自愈等,并通过实际案例分析自动化运维实施过程中的关键考量因素和挑战。
|
11月前
|
弹性计算 运维 数据处理
带你读《CloudOps云上自动化运维 白皮书2.0》之16:4. 提升弹性能力的建议与步骤
带你读《CloudOps云上自动化运维 白皮书2.0》之16:4. 提升弹性能力的建议与步骤
419 1
|
11月前
|
存储 运维 安全
带你读《CloudOps云上自动化运维 白皮书2.0》之6:3. CloudOps的定义与主要衡量指标
带你读《CloudOps云上自动化运维 白皮书2.0》之6:3. CloudOps的定义与主要衡量指标
138 0
|
11月前
|
弹性计算 运维
带你读《CloudOps云上自动化运维 白皮书2.0》之13:1. 弹性能力的基本概念
带你读《CloudOps云上自动化运维 白皮书2.0》之13:1. 弹性能力的基本概念
491 0

相关产品

  • 函数计算