首页 首页 人工智能 查看内容

IT系统运维管理研究

木马童年 2019-3-20 11:35 366 0

随着企业IT系统的日益成熟和复杂,企业运维的关注点已从单点管理到综合业务管理的角度转变,从关注单一网络转变到对业务系统的关注,原因在于,企业逐渐意识到,业务系统涉及的环节正在逐渐增多,单纯的通过对底层IT ...

随着企业IT系统的日益成熟和复杂,企业运维的关注点已从单点管理到综合业务管理的角度转变,从关注单一网络转变到对业务系统的关注,原因在于,企业逐渐意识到,业务系统涉及的环节正在逐渐增多,单纯的通过对底层IT基础设施的运维无法解决底层网络与上层业务系统之间的脱节问题,单一的网络运维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节,而对于业务系统的运维,企业缺乏对运维工作的统一管理和监督,业务系统停留在被动运维阶段。因此,为了更加贴近企业IT运维管理部门的工作需要,ITIL开始与企业的业务系统保障结合起来。

针对企业缺乏对运维工作的统一管理和监督以及业务系统被动运维的问题,ITIL运营级流程中的服务支持模块定义了详细的管理流程,通过事件、问题、配置、变更和发布管理的流程化指导,可以很好的帮助企业解决当前IT系统存在的运维问题,但是ITIL标准中并没有明确指出IT系统在开发阶段的运维流程,而在开发过程中,任务的发布分配以及进度监控不仅可以很好地对项目开发进行管理,还能控制开发成本,对任务解决方案的记录也有助于运行维护阶段的事件与问题处理,因此,开发阶段的运维同样重要,考虑到ITIL运营流程是一套通用的规范,想要运用到具体IT项目还得考虑实际情况做出合适的修改,因此,本文通过研究,改造了服务支持中的管理流程,在遵循ITIL运维的基础上添加了适合开发阶段的运维管理模块,通过文档管理、项目动态、进度监控和知识管理对开发阶段的各个方面进行运维,使其更加适合企业对IT系统的运维需求,实现IT项目全生命周期的运维,如图1 所示。

IT系统运维管理研究

图1 IT 项目全阶段运维

1 ITIL概述与分析

ITIL(Information Technology Infrastructure Library,信息技术基础架构库),ITIL是从大量企业的IT运维服务管理经验中总结出来的最佳实践,它以流程为导向、以客户为中心、通过整合IT服务于企业业务,提高企业的IT服务能力和水平,ITIL可引导组织有效和高效地使用技术,让既有的信息化资源发挥出更大的效能。

ITIL的核心模块是“服务管理”,这个模块一共包括了10个流程和一项服务台职能,这些流程和职能又被归结为两大流程组,即“服务提供”流程组和“服务支持”流程组,其中服务支持流程组归纳了与IT管理相关的一项管理职能及5个运营级流程,即事故管理、问题管理、配置管理、变更管理和发布管理;服务提供流程组归纳了与IT管理相关的5个战术级流程,即服务级别管理、IT服务财务管理、能力管理、IT服务持续性管理和可用性管理。

ITIL只是指出了IT运维应该做什么,并没有指出应该怎么做,因此基于ITIL,很多厂商又结合自己的实践经验提出了适合自身的实施方法论和相应的工具,例如荷兰Virje大学软件工程研究中心(SERC)组织开发的IT服务能力成熟度模型(IT Service CMM),微软公司为所有微软产品开发了MO(管理运营框架),HP公司开发了该公司的实施方法HP ITSM ReferenceModel(惠普IT服务管理参考模型),同样,本文也在ITIL的基础上,结合软件开发过程中的各个阶段,提出了适合企业维护业务系统的运维框架。

[page] 2 总体思路

2.1 运维框架

本文针对IT系统全生命周期运维的特点,按照ITIL服务支持的流程,设计相应的接口规范和服务,通过制定开发规范,使开发人员在IT项目开发时,在IT系统中设置服务台,通过封装好的服务接口在服务台调用框架中的web服务,将各个IT系统的运维信息保存在运维部门的数据库中,同样,可以在服务台展示知识库信息,方便用户自己解决一些共性问题,减轻运维人员的工作压力,IT维护部门通过框架中的服务接口,运维多个IT系统,实现一个运维平台统一运维多个IT系统的目的。

IT系统运维管理研究

图2 IT 系统运维总体框架

图2为本文研究的总体框架,最上面是开发阶段运维模块,针对项目开发进行管理;最下面是项目运行时期的维护模块以及每个模块对应的服务,中间部分是针对具体IT系统的应用,IT系统通过运维框架提供的服务,将本系统的运行信息反映到运维部门,方便运维人员进行统一运维管理;左右两部分用来存放运维系统配置信息和各个IT系统在运维过程中积累的知识信息,各个模块的主要功能如下:

2.2 主要功能

开发阶段

(1)文档管理

系统文档被公认为信息系统的生命线,它不是一次形成的,而是在系统开发、运行于维护过程中不断编写、修改、完善与积累而形成的,本模块将文档分为:用户文档、开发文档、管理文档和其它文档,主要负责对文档的上传、查询、下载以及文档的变更版本控制。

(2)项目动态

本模块是开发阶段非常重要的一个环节,负责对开发任务进行分配和记录,将项目开发过程中的任务细化并分配给个人,通过记录任务主题、实现方法和时间控制,将开发任务实时动态的保存下来,供管理者查看开发的详细信息,所记录的信息还能为后期维护提供解决方法。

(3)进度监控

实现对项目开发中的任务进行实时监控,将开发进度以可视化的形式展示出来,方便管理者及时了解项目的当前情况,根据项目动态中记录的任务信息,比如:任务开始时间、预计完成时间和实际完成时间,将项目中的所有任务多角度展示。

(4)知识管理

本模块主要记录项目开发中的重要技术问题及解决方法,通过对项目动态中有价值的信息进行提取,将重要任务的解决方案保存在开发知识库中,供后续开发做参考。

[page] 维护阶段

(1)事件管理

在系统运行时,通过事件接口获取用户在操作过程中遇到的问题,并将事件分配给运维人员进行解决,同时对事件处理的全过程进行跟踪和监督,对每个事件设置标题和关键字,方便用户查找类似问题的解决方法。

(2)问题管理

对IT系统影响大的事件以及暂时无法找到解决方法的事件可以升级为问题,组织专家对问题进行研究分析,并将解决方法记录在问题表中,可以通过查询项目动态中的开发记录来了解问题产生的根本原因。

(3)配置管理

将IT环境中的所有配置项信息以及配置项之间的关系记录到配置数据库中,为其他流程管理提供依据,对IT项目的配置信息提供可视化形式的操作,便于扩展。

(4)知识管理

同开发阶段的知识管理类似,主要记录共性事件和问题的解决方法。

服务层

运维部门负责对公司的多个IT系统进行运维,因此将通用的管理流程封装成web服务,部署在运维部门服务器上,不同的IT系统按照需要开发适合自身的服务台,在服务台调用封装好的web服务,实现自身的运维,在运行时,用户只需通过服务台就可以将遇到的事件和问题提交到运维部门。

由于在运维部门需要部署多个IT系统,设置服务层的目的不仅有利于实现对IT系统进行统一运维,另一个目的是可以将web服务发布在其他服务器上,从而在物理上进行分层,能从一定程度上减轻服务器的压力。

运维平台提供web服务接口,在IT系统的业务层中通过代理类对接口的调用实现相关功能,下图是事件服务的UML示意图:

IT系统运维管理研究

图3 事件代理示意图

2.3运维流程

运维流程如下图所示,IT系统的运维按照先“开发维护”后“运行维护”的顺序进行,开发维护阶段管理项目开发时产生的文档,记录各个模块的开发方案和监控项目进度,当需求变更时,及时更新文档和开发任务,运行维护阶段通过事件与问题管理,处理IT系统运行时的用户请求和系统故障,并将信息存入知识库,方便以后处理相同情况。

IT系统运维管理研究

图4 运维流程

[page] 3 开发思路

为了便于框架的扩展,降低各个模块之间的耦合度,框架的开发按照三层开发模式进行,即:表现层、业务服务层和数据访问层。

3.1 表现层

表现层的设计主要为了隔离UI、业务逻辑和数据层,职责的分离使应用程序容易维护,同时也能提高代码的重用性。

框架的表现层采用代理来实现界面和业务之间的控制,界面通过事件将数据传入代理类,由代理负责对业务实体进行操作,并将处理后的数据返回给界面。如下图5 所示。

IT系统运维管理研究

图5 表示层代理模式

首先将IView的实例(Page)与Presenter绑定,当用户激发页面事件后,页面激发IView中定义的事件,并通过事件参数传递相关信息提供给已绑定的Presenter;Presenter会根据绑定的事件的响应函数操作业务实体,并获取操作后的业务实体状态,然后根据业务实体信息更新页面的数据;最终页面展现更新后的页面信息给用户。

3.2 业务服务层

业务服务层包括业务层和服务层两部分,业务层负责处理框架中各个模块的业务逻辑并实现相应流程的操作,考虑到大型企业内部部门较多,不同部门使用的IT系统的部署呈现出分布性,因此,增加了服务层,通过在运维部门发布Web服务,方便不同IT系统的统一调用,服务层不仅用来实现远程调用,主要的功能是负责封装复杂的业务操作,并以门面形式发布简单化的服务接口,使得IT系统在调用框架功能时,不用了解具体的实现方法,通过简单的服务接口就能实现相应的功能,为了保证服务接口不违背具体IT系统的开发规范,开发人员可以在服务层与IT系统之间增加适配器类,将服务转换为需要的接口形式,如下图所示。

IT系统运维管理研究

图6 业务层外观展示与适配

3.3 数据访问层

数据访问层在系统中起着至关重要的作用,一个设计好的数据访问层可以为系统带来很大的便利,并且还能在不影响其他业务层的情况下,使替换数据访问技术、数据库成为可能,因此,考虑到框架的灵活性与可扩展性以及数据库的可变更性,引入了此层,通过代码的封装,隐藏了数据操作的细节,增加了代码的重用性,消除业务层对数据源的依赖。

本层通过基于接口和工厂的设计,实现通用的数据访问,在不同的数据源之间提供统一的数据操作接口,使业务层仅依赖于数据层接口,从而达到当底层数据库变更时不影响业务层的处理,为了彻底解耦数据层,框架中使用反射工厂技术,通过配置文件动态地决定使用哪一种实现。

IT系统运维管理研究

图7 数据访问层接口

[page] 4 元模型设计

元模型包括两部分,通用的数据字典模型和运维业务模型。

建立数据字典的目的主要是为数据管理、开发和使用人员提供有关数据的来源、说明、格式和其他数据的关系等信息描述。在系统完成之前,数据字典帮助开发人员理解真是世界,规范数据系统内数据的处理过程;在系统完成之后,数据字典帮助用户理解数据系统的功能,各项输入输出数据的意义,统一的数据字典有助于开发者建立数据模型以及程序和数据库之间的数据转换接口。

下图为运维框架的模型图,左侧深色部分为元数据字典模型,右侧为业务模型。

IT系统运维管理研究

图8 框架模型图

5 结语

本文基于ITIL服务支持的运维思想,通过研究IT项目开发的流程,针对企业运维部门的特点,在ITIL的基础上添加了对项目开发的运维流程,提出了一个运维框架,在此框架的基础上分析了IT系统运维的各个模块,通过开发阶段的动态维护和进度监控、维护阶段的事件和问题管理以及知识管理,实现IT项目开发与运行全生命周期的运维。

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

基础设施 运维管理 解决方案 信息技术 基础架构 信息化
0