什么是网络运维?网络运维就是为了保障企业电子业务的安全、稳定和高效的运行而采取的生产组织管理活动,简单来说就是各种IT维护手段。那么,目前大部分企业网络运维的现状是怎样的?
工具繁多,手段繁杂
    经过这么多年IT的发展,每个企业的管理及维护人员在每天的管理及维护工作中,对自己IT业务都有了自己一套流程化的维护手段。我们不否认这些维护手段无效,毕竟这么多年沉淀下来肯定有它处理故障或者维护上的功能特点。我们在很多企业里面做交流的时候就发现,好多企业的维护管理人员手上都拥有着大批的工具,也是俗称的“枪”。当维护中出现故障要处理的时候,我们的管理员就好像士兵一样,拿着他们的各种枪硬着头皮上战场,有时候一些枪可以起到一枪定乾坤的作用,有的时候是将各种武器都用完了还是无法完成战争的胜利,于是乎又去寻找各种各样的枪,长此以往,我们发现好多企业的管理人员都有了自己的战争经验,面对不同的战役他们能够灵活的使用各种武器来取得战争的胜利,虽然每次耗时很长,但是他们乐此不疲,并以此为荣。我们在惊叹他们的执着的探知欲的同时,也为他们捏了一把冷汗。如果下次,他们碰到了一场需要速战速决的战役而他们又没有合适的武器的时候,那结果会怎么样呢?
管理被动
    相信“救火队员”这个称号是我们IT部门理解最为深刻的角色定义。很多管理员在颇为烦恼做这样的角色的同时,每天又重复的担任这样的角色。因此,很多管理员都具有这样的通性,那就是IT业务没问题的时候神情特别轻松,但是一旦处理故障的时候就特别紧张,尤其是涉及到企业核心电子业务的时候,那更是全体动员,赶快恢复业务运行,要是正好领导亲自来部门督战,那更是可以紧张到汗流浃背。说了这么多,相信大家都深有体会,几年前我也在一个期货公司做了一段时间,那个时候交易期间是绝对不能出现任何问题的,因为一旦业务有点问题,就会涉及到无法想象的现金损失,因为交易期间任何一秒钟都有大量的金钱交易。因此,那个时候在交易前,交易后我们会有大量的巡检工作去逐步巡检网络设备、服务器、应用系统的运行状况。而交易期间,我们只有祈祷不要出现任何故障。每天的工作量就集中在巡检和日常维护上,虽然工作量不算太大,但是及其被动及紧张。
故障不关联,IT与业务不关联
    往往一个故障出现的时候,是会造成很多其它的故障。比如说,我们一个核心交换机的端口出现故障,宕机了,那么我们应用部门的管理员就会发现他的应用系统连不上了,服务器管理员会发现他的服务器连不上了,网络部门的人会发现有一个子网掉线了。然后三个部门的人分别查找他们的故障。其实这些个故障,它的故障点就是网络设备的接口坏了。所以我们在平时维护工作中,会碰到很多比这个更复杂的类似情况,而导致很多人员故障处理效率很低,往往浪费很多时间而没有找到故障源。还有很多情况,我们的管理员往往维护重心分散,导致很多人负责部分IT资源的维护,这样做的好处是物尽其用,每个人都负责自己最擅长的领域,但是这样也会造成很多问题,负责网络的人不知道一个网络设备的接口连接到哪个服务器,或者根本就不知道那台服务器上跑了什么应用系统,如果该链路断了,会影响什么业务系统,很多管理员并不清楚这些IT资源的关联性,甚至与业务系统的关联性。这就造成了很多业务出现故障后,就更难查找故障源了。
发展趋势分析
    综上所述,分析了当前网络运维的三大疑难现象,我们就要着重的在这些方面做出改进。首先,用统一的运维管理平台取代过去的各种管理工具。用故障关联处理,分析故障源,提高故障处理效率。用业务服务管理来关联IT与业务,使所有管理员都清晰的直观的看到IT各部分资源与业务的关系。
摩卡解决方案
    摩卡业务服务管理(Mocha BSM)以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。我们投入了大量的人力物力在基础设施和IT应用上,却无法将IT投入和业务的支持建立量化的关系,如何才能更好的管理基础设施和应用? Mocha BSM能够监控基础设施和应用,也能够将复杂的IT设施转化为简单的业务视图,使我们从IT服务的角度,保障IT部门提供稳定可靠的服务。一个业务服务是由网络、主机、应用等几个组件组成,一旦某个组件出现问题,问题就会反应在业务服务上面。用户(包括业务部门)只关心提供给他们所使用的IT服务,服务是不是宕了,还是服务为什么这么慢,而不关心具体的技术细节。通过服务仪表盘,IT部门可以随时了解到业务服务的运行状态。