关于自动化运维的思考-基线

简介: DevOps几年前来看,基本都在提概念,这几年很多公司都在落地了,公司里每个自动化运维平台都不好意思。具体落实下来,做得好还是不好,水平也层次不齐。 我们不说自动化运维的意义,不讨论要不要做自动化运维。

img_0dabdcec39678c6f3aa64fa07640ec62.jpe

DevOps几年前来看,基本都在提概念,这几年很多公司都在落地了,公司里每个自动化运维平台都不好意思。具体落实下来,做得好还是不好,水平也层次不齐。

我们不说自动化运维的意义,不讨论要不要做自动化运维。做是肯定要做,然后每个人都会有一堆的问题或者想法冒出来,why,how,when,有想法是好的,最大的问题是不知道问题在那里。

从我的理解来简单说说基线,一般来说会有如下的几个问题,基本涵盖了3W

img_a68b7d5a6b523dc8e6c481e77c1b2a29.jpe

我们来逐个说一下,不对的地方欢迎拍砖,我及时纠正。

需要做一个什么样的平台

1)在这里确切的说是DB自动化平台,因为目前的主要是数据库方向的。

2)后期怎么和其他部门的平台集成

先把DB层面的工作做好,做好了,你说的话才能让人觉得靠谱。

内部先达成共识,我们要一起做,不是你做吧,我用就好了。

3)业务价值和技术价值

短期内看只有技术价值,业务价值不大,但是成为平台后,或者有一些业务对接之后,价值才能发挥出来,就好比一辆车停在那里,还要付停车费,一旦跑起来了,业务价值远大于技术价值

谁来开发维护自动化平台

1)常见的瓶颈

开发不了解DB层面的业务,DBA对于开发的技能不够熟练,这是现状也是普遍现象。

2)DBA全员开发

能者多劳,每个人都要参与,所以我最近疯狂调研,搞开发,搞前端。

分工协作,等定好了之后,一起看看怎么分工,每个人能够承担一部分的功能,都能参与进来。

3)开发能力不够怎么办

先抛开技术,看看能做什么,需要做什么 --产品规划

前期的引导和技术预研 --技术选型和规划

由小及大,模块化实现 --避免好高骛远,眼高手低

使用什么技术架构

个人理解主要分为Python栈和Java栈,还有其他的比如go等等。

1)Python栈

前端WEB

Bootstrap

后端WEB

Django

任务调度

Celery + Redis

Celery + MQ

批量操作

ansible

2)Java栈

前端WEB

后端WEB

任务调度

Jenkins

opencron

批量操作

3)数据库

MySQL

SQLlite

自定义ORM

是否需要agent

这个问题几乎无解,在有限的服务器规模怎么理解都没错。看你侧重于哪些考虑了。

有agent,数据采集和性能监控还是比较给力的。

没有agent,松耦合,部署快捷简单。

需要实现哪些功能

这个问题,如果是打算重构,重做,几乎每个人都会问,我们可以还个角度来考虑一下,自己问自己,这样也许也会有一定的收获。

1)可以反问,目前有哪些痛点

2)目前有哪些工作可以改进

3)希望今后做哪些方面的事情

可以借鉴的开源方案

目前可借鉴的方案还是蛮多的,而且国内目前开源的很多方案还是很不错的。开源项目可以参考最近火热的国内开源项目评选。

http://www.oschina.net/project/top_cn_2017?from=hometop

里面有很多非常不错的项目。

目录
相关文章
|
1月前
|
运维 Prometheus 监控
构建高效自动化运维系统的关键策略
【2月更文挑战第30天】随着云计算和微服务架构的兴起,现代IT运维环境变得愈加复杂多变。为保持业务连续性、提高响应速度并降低成本,企业亟需构建一个高效的自动化运维系统。本文将深入探讨自动化运维系统构建过程中的关键策略,包括工具和技术选型、流程优化、监控与告警体系搭建以及持续集成/持续部署(CI/CD)实践,旨在为读者提供一个清晰的构建蓝图和实用的实施建议。
|
11天前
|
运维 Prometheus 监控
构建高效自动化运维流程的策略与实践
【4月更文挑战第13天】 在现代IT基础设施管理中,自动化运维已成为提升效率、确保稳定性和快速响应变化的关键因素。本文将详细探讨构建一个高效自动化运维流程的战略规划、关键技术选型以及实际执行过程中的最佳实践。我们将通过具体案例分析,展示如何整合配置管理工具、持续集成/持续部署(CI/CD)管道、监控告警系统以及日志分析平台,来形成一个协同工作的整体解决方案。文章的目标是帮助运维团队构建出能够适应不断变化需求的自动化框架,实现运维工作的标准化、系统化和智能化。
|
15天前
|
存储 运维 监控
构建高效自动化运维体系的关键步骤
【4月更文挑战第8天】 在快速发展的IT环境中,自动化已成为提升运维效率和可靠性的核心驱动力。本文将详细探讨构建一个高效自动化运维体系的必经之路,从基础设施的自动化部署到监控、故障响应与修复,再到持续的性能优化。通过分析具体的技术实现和最佳实践案例,揭示如何利用现代技术栈打造能够支撑复杂服务架构的自动化运维平台。
|
19天前
|
人工智能 运维 监控
构建高效自动化运维体系:策略与实践
【4月更文挑战第5天】在数字化转型的浪潮中,企业IT基础设施变得日益复杂多变。为保持竞争力,组织需转向高效自动化运维,以提升响应速度和服务质量。本文将探讨构建自动化运维体系的关键环节,包括工作流程自动化、监控预警、以及持续集成/持续部署(CI/CD)的实施策略。通过分析真实案例,揭示如何利用现代技术实现运维效率的最大化,同时确保系统的稳定性与安全性。
|
3月前
|
运维 监控 测试技术
ansible 自动化运维监控方案
本文介绍如何利用ansible实时或自动采集受控主机的信息
|
8月前
|
缓存 JSON 运维
自动化运维 2
自动化运维
|
8月前
|
运维 Shell 网络安全
自动化运维 1
自动化运维
|
11月前
|
运维 Devops 持续交付
带你读《CloudOps云上自动化运维 白皮书2.0》之34:2. 自动化能力评估
带你读《CloudOps云上自动化运维 白皮书2.0》之34:2. 自动化能力评估
|
11月前
|
运维 监控 算法
带你读《CloudOps云上自动化运维 白皮书2.0》之36:4.弹性评估
带你读《CloudOps云上自动化运维 白皮书2.0》之36:4.弹性评估
|
11月前
|
运维
带你读《CloudOps云上自动化运维 白皮书2.0》之33:1. 成本管理和控制评估
带你读《CloudOps云上自动化运维 白皮书2.0》之33:1. 成本管理和控制评估

热门文章

最新文章