企业运维管理论文

2024-06-26

企业运维管理论文(精选12篇)

企业运维管理论文 第1篇

关键词:管理模式,运维,调控,发展

0 引言

企业的日常工作对IT系统的依赖性越来越大, 对IT基础设施稳定性和安全性的要求日渐提高。信息运维管理工作不再等同于简单的系统维修、系统故障排除, 其核心价值在于帮助企业实现精益化管理, 为企业提供优质的服务。这几年来随着电力公司对信息工作逐渐重视和不断开展, 信息运维管理工作在各二级单位中发展的也比较快。试验研究院不断总结以往经验, 继承和发扬北京市电力公司的先进理念, 学习新的技术, 改善管理模式, 相比过去简单的管理方法有了巨大的飞跃。信息工作发展变化非常快, 新的工作需求对信息运维管理工作不断提出新的考验。试验研究院在信息运维管理模式上着重对职能、设备、网络、系统、应用的管理。学习并建立了新的管理模式, 以人为根本, 精益化管理, 构建智慧性组织结构, 充分发挥各部分的作用。这五部分目前组成了信息运维系统的整体架构。它们之间互相制约、相辅相成。稳定运行的设备和网络是基础, 之上才能有系统、应用的发展, 职能发挥是根本性保障。应用这种管理模式, 信息工作将更加安全稳定, 为企业提供可靠的保障性服务, 为信息工作的发展铺平道路。以下, 对管理模式包含的内容和相互关系做一详细介绍。

1 管理模式的内容

1.1 职能管理

电力信息运维管理工作的职能管理突出信息维护人员及工作的作用, 为领导的决策提供可供参考的具体依据。

职能管理包括信息运维管理制度的制定与考核, 对企业职工进行信息的专业培训和自我提高, 对硬件资源、软件资源的调控分配, 对取得成效的信息工作进行宣传推广, 主动式的定期信息运维巡检工作。

1.2 制度考核

为了规范信息管理工作, 试验研究院相继制订了各项管理制度, 并且不断加以完善。以往虽然做了很多工作, 但是由于制度的不完善, 执行的不彻底, 很多成果并没有得以实施贯彻下去, 给管理造成很大的困难。经过这几年制度的不断完善与执行力的提高, 试验研究院管理上严格也严谨了很多, 许多工作目标依靠制度考核得以实现, 并且取得了很大的成效, 极大提高了员工的信息工作意识。

基于以上现实情况, 我们会依赖信息化系统, 网上自动化对员工的相关考勤、工作不定期检查等以此监督员工从而使得考核机制更合理化人性化。

1.3 专业培训

这里包括对企业职工的培训, 也包括对信息工作者自身提高的培训。以往, 只有对入企大学生的培训、计算机基础的培训和办公自动化OA的培训工作。现在, 已经远远不能满足实际工作的需要了。基础知识是一方面, 更着重于应用。针对不同的专业, 不同的需求进行培训, 听取职工反馈的意见, 改进培训方案。

作为一名合格的信息工作者, 要不断提高自身的技术水平与工作能力, 这样才能在岗位上发挥最大的潜能, 接受每一项挑战。信息培训工作要做到以人为本, 提高企业的整体信息水平。

作为信息化建设的一部分, 我们会在共享网络域内提供专业话的培训视频、课件和教育电影, 以使得电力行业职业化安全素养教育贯穿于日常工作中。

1.4 资源调配

资源调配是其他管理模块中的设备调控、网络调控、升级优化、权限调整的统一名称。资源包括硬件资源与软件资源。硬件资源包括各种IT设备, 软件资源包括系统及应用软件, 应用系统的权限等等。试验研究院对资源调配的管理比起以往更加严格, 每一项都建立了相关的流程。例如, 设备申请、升级的流程、应用系统权限的申请、变更的流程等等。通过资源的合理化调配, 精益化管理, 提高了资源利用率。

电力行业资源调配的业务相对企业行业是比较复杂的, 这里我们同样是依赖信息化资源, 现代化硬件设备权限设置, 使得有权限的人才能使用相应的设备资源, 从而合理、高效地实现资源的调配。

1.5 宣传推广

信息工作的宣传不仅能把工作的进度和成果进行通报, 而且为开展工作做一良好的铺垫。让职工看到信息工作人员的工作, 提高信息工作的重要性。同时, 对已经取得成绩的工作加以推广, 让更多的人从中获益。

电力门户网站上, 我们会设定专门的版块来, 进行相应的宣传和推广。

1.6 定期巡检

总结以往工作的经验, 统计维护记录的类型、处理方法, 实施定期的巡检工作。这里巡检的工作包括其他管理模块中的设备维护、网络维护、系统维护和应用维护。使得维护工作变被动为主动, 在计划安排下, 执行统一性操作, 及时发现安全隐患, 降低故障发生率。试验研究院自去前年开展巡检工作以来, 发现了安全隐患及时处理, 各类故障发生率明显下降, 也为其他管理工作的开展节约出了宝贵时间。

2 设备管理

设备管理是信息系统运行的基础, 是对设备整个生命周期的掌握。为随时发生的需求提供资源, 为重要系统提供可靠地后备保障。设备管理包括设备的统一采购、库存的管理、设备资源的调控、设备的性能优化与定期保养、定期维护。

2.1 采购管理

采购主要包括计算机等设备、配件耗材及软件等。采购资金走ERP系统, 提前预报资金计划。虽然步骤比之前多了, 但是更加严谨。采购计划根据需求制定, 厂商货比三家, 价格不是最重要的, 关键在于产品的质量和服务。

2.2 库存管理

库存管理的对象包括新购设备、维修的设备、备品备件、借用设备及退运设备。

(1) 新购设备做好出入库记录, 设备明细登入台帐。

(2) 维修的设备做好标记和维护记录, 需更换更新时提交采购申请。

(3) 备品备件经过测试, 定期检查, 随时接替运行设备工作。

(4) 借用设备主要是不能够按需分配的, 不经常使用的重要设备。借用时做好相关记录, 借用借出人员要求签字。

(5) 退运设备做好登记, 统一保管统一处理。

2.3 设备调控

设备调控是在设备变更申请被批准的情况下, 由信息职能部门根据用户的申报需求和工作需要进行统一调配。体现了IT设备的归口管理。同时, 也包含信息职能部门根据信息发展变化统一计划调配设备。

2.4 优化保养

优化保养也是定期巡检的一部分内容。通过更新配件而优化设备的整体性能, 关注运行中设备的健康状况, 主动做好计划对设备进行保养工作。例如, 上半年试验研究院对全院的打印机设备进行了全面的保养工作, 极大地延长了打印机的使用寿命, 同时宣传打印机正确的使用方法和保养知识。

2.5 设备维护

做好设备维护关键在于对设备维护记录的数据积累, 避免故障重复发生。

3 系统管理

系统运行的重点在于稳定地、高性能地运行多种应用。包括系统的安装维护、升级优化性能、安全加固, 以及推行桌面标准化。

3.1 系统安装

对于新购置的计算机设备, 安装系统相关的软件及应用软件。

3.2 安全加固

提高系统的安全性, 包括补丁升级、安全设置。

3.3 升级优化

定期对系统进行整理和调整系统参数以优化性能。

3.4 桌面标准化

桌面管理标准化是一个综合的系统问题, 涉及管理计算机本身、计算机应用、计算机操作者、计算机使用单位规范等多个方面的要求性因素。从终端状态、行为、事件三个方面来进行防御。强化了对网络计算机终端状态、行为以及事件的处理。

3.5 系统维护

系统的安装、升级优化都属于维护范畴, 还包括一般性的故障处理, 操作问题。

4 应用管理

包括应用系统的自行开发, 数据资源的共享, 应用系统权限的调整, 数据备份保护和应用系统维护。

4.1 应用开发

随着工作量、标准化、流程化需求的增加, 需依靠信息系统来解决。信息工作人员不断提高自身开发能力, 体现职能管理, 通过对业务部门的需求调研、分析, 来建立信息平台为解决方案。

4.2 数据共享

人员不断变化, 数据资源不断积累, 建立文件服务器为企业员工提供一个数据资源交流的空间。并且对资源进行权限控制, 加强保密性。

4.3 权限调整

通过建立申请流程, 对各应用系统的权限, 根据变更进行调整。

4.4 数据保护

建立备份方案, 对重要的数据资源进行24小时备份, 同时对数据的导出加以控制, 遵守数据保密协议。

4.5 应用维护

协助各部门为应用系统提供技术支持。

5 结语

企业运维管理论文 第2篇

论文摘要:文章从电网企业设备运行维护费的管理现状入手,分析目前运维成本管理中存在的不足,针对新环境下会计人员如何改进工作提出参考意见,旨在通过总结经验,探讨运维成本管理重点,为电网企业降低成本,提高公司效益提出改进建议。

一、运维费管理取得的进展

运行维护费,指的是维持电网企业设备正常运行的费用,主要包括材料、修理、人工及其他费用。“十一五”期间,河北省电力公司投入80亿元用于沧州电网建设,沧州电网发展进入一个黄金期。随着电网的加速发展,电网资产的修理、维护、检测、更改任务日趋繁重,运维费支出呈逐年递增趋势。如何控制好电网运维支出,给新时期的会计工作带来一定挑战。近几年,经过公司财务标准化、集约化、信息化等项目建设,运维费管理水平取得了长足发展,表现如下:

(一)建立完善的费用管理体系

沧州供电公司经过多年实践发展,以预算为指导,以成本核算为基础,以资金控制为重点,强化工作督导,奖罚并重,建立起较为完善的运维费管理闭环体系,覆盖了公司成本支出的方方面面。形成目标成本→指标分解→实际控制→信息反馈→措施对策→争取最大的效益的完整管理流程。

(二)实现费用的可控在控

工作中坚持不断规范日常基础资料,强化成本分析,建立健全科学实用的考核评价体系,提高会计信息质量,提高各项分析报告的针对性,及时全面查找成本费用升降的原因,及时针对问题提出改进措施,有效确保成本费用指标的可控在控。

(三)费用节约意识明显增强

电网企业运维费用按照支出对象细分为修试、运行、配网、线路、通信、房屋几个大类进行归集。对比分析费用支出动因,积极优化生产性支出,大力压缩非生产性开支。实行归口、分级管理,费用归口管理部门责任人及主管领导按照预算指标要求执行成本计划,严格控制各项费用支出情况,做到费用支出合理、发生均衡。努力改变长期以来在计划经济条件下形成的花钱大手大脚的不良习惯,费用节约意识、效益观念明显增强。

二、运维费管理中的不足

经过不断实践,尽管运维费管理取得了长足的发展,但随着电力体制改革的深入推进、外部监管力度的不断加强以及与企业自身建设一流管理现代公司的长远目标相比,仍存在较大差距。

(一)缺乏细致的支出标准体系

运维人员对设备的运行和维护大多依据原始设计手册和工作经验定期进行,未能与设备实际使用情况相结合。目前公司的预算管理其实是一个讨价还价的过程,经过“自下而上、自上而下”的循环,最后形成一个刚性相对较强的指标,对某一项支出的核定主要依靠经验估计和历史成本。而运维支出与设备本身服役年限、运维人员管理水平、生产厂家的设计工艺等都有很大关系。结合公司技术指标、管理指标、计划值等研究制定一整套细致合理的标准成本管理体系,为公司管理指标的分解和考核提供坚实依据,是目前运维管理的迫切需求。

(二)费用控制精细化程度不够

账上可以体现某项工程、某座变电站、某类设备、某个工区的全部运行维护成本,但无法细分到每一个具体设备。例如,某年在某台变压器上消耗的材料、修理、工时等成本是多少,很难找到相应的统计数据。账务数据只能单纯反映价值量信息,难以与实物信息直接挂钩,造成财务工作与业务工作脱节,加大了费用控制难度。另外,归口责任部门管理,各管一摊、各唱各戏,各环节人员较多站在自己的立场上考虑问题、开展工作,没有形成整体最优的合力。

(三)运维费管理机制有待加强

公司运维费分析与评价体系侧重于指标的完成,而对于成本支出是否完成了规定的任务,完成的质量如何等核心问题缺乏必要的监督与控制手段。

(四)部门之间工作协同性不够

就费用支出部门而言,费用控制目标简单化,把费用控制的目标定位在完成上级单位下达的成本指标上,既不要超支,也不要节约;费用控制责任单一化,从省公司到供电公司再到部门、班组,存在把成本控制责任向上往财务部门推的思想,加之业务人员与财务人员的专业知识相对独立,缺乏工作的紧密协同,使得成本控制职能相对弱化,尚达不到集约化管理的要求。

三、运维费管理的改进建议

(一)深化标准成本应用体系

随着国民经济的发展,物价水平的变化,生产条件的变化,消耗定额与实际支出之间的差额是客观存在的,而且有的消耗过去没有制定过定额,这就要求我们根据实际情况制定、修订各项定额,组织生产、物资、安监、财务等业务专家对原有标准体系进行修订完善,细化业务参数,建立包括各级变电设备容量、线路长度、资产、人员等的业务基础数据库,结合设备运行实际情况,使动因数据不断更新,努力寻求各成本费用的真实挂钩因素。组织基层班组开展作业成本管理,并在实际运用过程中进一步细化和完善,确定出各基层单位的消耗用量、单位成本。

(二)按单台设备归集运维费

借助信息化平台先进手段,将运维费支出过程的每个工作节点固化到信息系统,每次运维检修工作针对具体维护对象,从需求申报开始,到批准、采购、入库、出库、付款等一系列后续工作都与该设备相对应,将发生的材料、修理费等按照维护对象进行归集。从而对设备不仅仅有采购、安装等投运前的成本,而且有后期维护的详细支出。

经过一段时间基础数据积累,便能够更加科学、真实、准确地与公司制定的标准成本进行比较和分析,指导后期标准的修订与完善,通过对不同单位同类设备的比较,可评价各单位的运维水平,推广先进的运维经验,优化运维策略,减少运维成本,延长设备服役年限;通过对不同型号设备的分析,可指导电网规划设计和设备选型;通过对不同厂家同类产品的分析,可指导设备的招标采购;对公司资产全寿命周期管理工作的深入开展起到推动作用。

(三)建立有效的成本管理机制

按照PDCA闭环管理的理念持续完善运维费管理流程,形成从预算到执行直至监督考核的事前、事中、事后全过程良性循环。事前阶段在保证完成预算目标基础上开展动态成本分析,建立与运维水平、资产寿命、设备容量等挂钩的弹性预算机制,提高成本管理意识,严格执行计划审批程序,加强资金使用控制,扭转财务部门事后报账的被动局面;事中阶段针对计划、执行、评价、考核等重要节点工作,制定相应的绩效考核指标,将责任落实到具体部门、具体人员,不断提升运维费管理水平;事后阶段完善监督考核机制,加强对运维费支出的合理性、运维工作质量的审计检查,并根据监督检查结果提出奖罚意见,对造成公司损失的追究相关部门和人员责任,对合理配置资源、降低成本的,根据降低额度给予相应的奖励。

(四)培养复合型人才

在新的经济时代,企业的竞争归根结底是人才的竞争,电网企业的财务复合型人才,则是基本素质和专业素质都要高于群体水平的财务人才。前者包括合格的思想品德,较强的身体和心理素质;后者不仅包括精通财务专业和一种以上其他相邻学科的理论知识、技能,还应包括丰富的实践经验、善于组织管理并能利用多种相关专业知识处理财务实务及其他涉及财务工作需要解决的综合性问题等能力。

企业应制定合理制度,“唯才是举,用人所长”,重视复合型人才的使用,对财务复合型人才实施政策倾斜,给予精神和物质鼓励,用人不拘于财务专业,一线运维管理人员通过培养也可参与到财务工作实际当中,而财务人员通过非电专业电力知识培训等有效途径,掌握一定生产技能后参与到生产实践,积累生产经验后指导财务管理工作。并根据形势的变化提早对财务人员进行再教育,采用“培养→任用→再培养→再任用”的优化循环机制。

大型企业IT运维服务管理思路探讨 第3篇

关键词:大型企业;IT运维服务;管理思路;探讨

中图分类号:F270.7 文献标识码:A 文章编号:1006-8937(2016)08-0155-01

21世纪是信息大爆炸的时代,很多现代企业也紧跟时代脉搏,一方面维护和深化运用各类已有的业务系统,另一方面通过更新已有系统和设立新的系统等方法不断提升信息化程度。其中,如何合理地分配和运用信息资源以有效地实现IT服务管理,以及如何维护和更新现有信息系统以实现系统稳定高效地运行日渐成为企业决策者和领导者关注的重点。譬如,很多企业已普遍引入了各类业务系统,包括办公系统、营销系统、财务系统和人事系统等,甚至有的大型企业已经营建了上千个IT系统,它们构成了企业内部支持组织业务运作的IT基础架构,起着至关重要的作用。

由于这些系统日趋多元化,规模越来越大,复杂程度越来越高,如何有效地运作IT基础架构,如何对这些软硬件设施进行规范地的维护,使其支持的企业实现业务目标是IT运维管理所必须解决的问题。

1 大型企业在传统的IT运维服务管理中面临的问题

很多大型企业在传统的IT运维服务管理中面临着一系列大大小小的问题。本文指出三种比较有代表性的问题。①缺乏一套完整的IT服务及监控平台。在进行系统监控和服务管理方面,这类企业还在依赖落后的手工方式,不但会导致IT运维效率低下,而且客观上限制了信息化建设的进一步发展,这也有违信息化发展的大趋势,势必面临被淘汰出局的风险。②很多企业内部IT服务还没有一套完整的报修平台,这从某种程度上会桎梏IT服务的提升。③很多企业内部IT服务中还没有完整的服务流程。比如信息系统项目建设中,没有规范的硬件、软件上线流程,系统建设后进入运维时也没有规范的变更管理和事件流程。

2 IT运维服务管理的最佳实践—ITIL

ITIL (Information Technology Infrastructure Library,信息技术基础架构库) 是IT服务管理最成功的实践结果,并业已成为IT界运用最为广泛的一种服务方式。被奉为实际应用的指南和典范,ITIL不仅涵盖了如何进行IT管理及相关的设置流程的描述,而且具有诸多优势。它不仅能有效且全面地对IT技术的运用进行指导,而且有助于使IT资源在发挥自己的效用和功能方面实现最优化。

除此之外,信息技术基础架构库可避免企业的IT服务管理实践主观化,为其可量化、细致化和有针对性提供条件。正如周涛所指出的,“用户们可根据自己的实际情况来对自己所需的各种服务水平进行定义,根据信息技术基础架构库对IT 基础架构与服务管理作出相应的规划并执行,以保证企业的业务可获得IT服务管理的更多支持。”(周涛,2014)对航空运营管理而言,实施ITIL能将IT和业务完美地整合在一起,以实现企业利益最大化。

3 东方航空公司内部IT服务管理战略目标探讨

笔者接下来对东方航空公司内部IT服务管理战略目标进行分析,以指出大型企业未来实施基于ITIL的运维管理体系的必要性以及意识到这一点的企业领导者的前瞻性。

由于落后的运维模式以及运维中层出不穷的一系列问题,东航高层提出了IT建设新思路,据此, IT运营中心成立,作为公司IT组织架构中最重要的组成部分之一。它的成立意味着一个稳定、高效和灵活的信息系统运行和维护管理体系即将形成。这无疑会为公司各业务系统正常运行提供有力的支撑,提高信息系统运行效率,提高服务质量,降低运营成本,为实现公司的战略目标提供坚实的基础支撑。

但是IT运营中心高效、稳定、灵活的运行离不开ITSM系统、网络主机监控系统、桌面管理系统等基础架构建设的支持,因此,东航信息部决定考虑在IT运营中心建设初期投资建设相关基础架构平台,为IT运营中心的顺利运行打下坚实的基础。

IT运营中心基础架构平台的建设在ITIL最佳实践的指导下,结合东航实际IT运维情况,通过持续优化的IT治理,逐步提高信息技术管理的成熟度,按照IT总控中心的管理模式建立一个以单个统一CMDB为核心IT管理数据源、以业务为目标、以服务为导向、以流程为纽带、以集中化监控为手段的一套完整、安全、高效、先进的IT运维管理体系。

基于ITIL最佳实践经验,打造符合自身特点的IT服务管理管理中心,以帮助规范IT员工的工作流程和工作职责,最大限度发挥资源的优势,避免人员不规范带来的影响,并为IT团队建设提供必要的管理和评估数据,形成以下ITIL系统建设目标与框架:

整个项目初期总体规划是:“三个流程一个职能一个平台”,其中三个流程就是ITIL中服务支持中的三个最实用也最见效的流程,分别是事件管理,配置管理与变更管理。一个职能,就是整合外包公司与上航IT运维服务的东航服务台管理。一个平台,就是一个统一的系统及网络监控平台。

初期考虑在建立东航自主的统一的服务台,在此基础上监控外包公司的IT事件,采取以点带面的方法,识别对公司业务最核心最关键的7*24的IT服务,并针对这些服务建立起cmdb(配置管理数据库),建立起配置管理流程,对运行这些关键服务的相关服务器,应用服务器,数据库服务器、相关网络设备以及机房相关设备等进行重点监控。

另外,东航也设立了各个流程的具体目标,包括服务台、事件管理、配置管理、变更管理和知识库管理。具体如下:①服务台。将建立整合东航,外包公司以及原上航IT服务的整合的服务台职能,最终达成统一界面,统一受理,统一解决,统一反馈的东航IT服务台。服务台是所有服务管理工作的中心点。所有客户服务请求(无论是通过电话、电子邮件还是自助式服务界面发出的)都能通过服务管理渠道实现,服务管理模块可协助IT人员高效地集中、分配任务,管理和解决问题。②事件管理。事件管理流程是减少或消除存在或可能存在IT服务中的干扰因素给IT服务带来的影响,以确保用户可以尽快恢复自己正常工作。因此,服务台要将事件记录下来并分类,再分配给适当的专业人员去处理;东航服务台也要监控重要事件的发展;并在事件得到解决之后将其终止。③配置管理。管理是配置管理数据库(CMDB)的核心组件,可以建立支持复杂技术和业务视图配置的资产库。配置管理使处理任何类型的服务请求或问题的技术人员都能够确定受到配置条目影响的业务功能。④变更管理。变更管理旨在管理变更的过程,以及相应地减少错误和与变更有关的事件。变更管理的目标是确保标准方法和工序被使用,以便尽可能地降低与变更相关的事故对于服务质量的影响。⑤知识库管理。知识库可提供强大的“学习”搜索引擎,用于现有案例解决方法的搜索。技术人员按下按钮便可对现有解决方案库进行搜索。借助类别、子类和问题描述文本等案例输入,启发式搜索引擎将提供解决方案。

从这些目标也可以看出,实施ITIL可避免前文所述的传统的IT运维服务管理中普遍出现的问题。譬如,服务台和知识库管理能避免传统IT运维管理中缺失一套完整的报修平台的尴尬,不但能通过多种途径实现报修,而且能有效地提供多种解决方案,从而使整个企业和谐安全地运转。

4 结 语

总之,随着信息大爆炸和企业全球化竞争的加速,IT 正逐步朝着企业信息化建设和IT 服务管理的方向发展,IT服务管理成为企业业务运作过程中不可或缺的重要一环,通过ITIL 对企业的IT系统及架构进行规划、建立和整合,对现有IT 资源进行重组,全面而集中的管理,使IT系统的价值得到更充分的发挥,才可确保生产业务能够平稳、高效地运营,从而促使企业更快速地发展。

参考文献:

[1] 赵晨,干红华,蔡晓平,等.IT服务管理[M].北京:人民邮电出版社,2012.

[2] 周涛.基于ITIL理念的运维体系的探析[J].中国新通信,2014,(6)

[3] 王毅.基于ITIL的IT服务运维管理体系研究[J]. 硅谷,2014,(3).

企业IT运维服务管理模式研究 第4篇

1 企业IT运维管理的现状及存在的问题

第一, 由于地域和行业的不同, 所以企业的IT运维管理模式也存在一定的差异。有的企业在管理中习惯使用传统的运维模式, 而有的企业则喜欢应用先进的企业运维管理模式。第二, 即使在同一个企业, 由于级别的不同, 所以其管理方式也存在一定的差别。但是整体来讲, 我国大多数企业的IT运维管理都存在以下问题。

1.1 IT运维管理的服务导性没有得到重视

随着经济时代的发展, 企业的规模也在日益壮大, 在对IT运维管理提高要求的同时, 管理也变得越来越复杂。企业的IT运维管理为什么总是会出现问题, 因为企业的IT运维管理缺乏整体性的管理, 只注重事中管理和事后管理, 从而忽视了IT运维管理的服务导向的重要性。针对这种现象, 则需要在IT运维管理中, 重视对企业IT运维管理的全局性规划, 促使企业的组织能力得到有效的提高。

1.2 IT运维管理的体系不健全

IT运维管理有着较为广泛的范围, 由于大多数企业的IT部门不是按照IT基础机构的功能划分的, 就是按照企业业务的模块进行划分的, 所以企业在日常的IT运维管理中, 既没有办法对IT服务人员的工作进行考核, 也无法监督IT服务人员处理故障的效率及质量。其次, 往往企业IT的运维管理在出现问题时, 并不是单一环境出现问题, 只有企业的多个部门相互协作才能解决问题的关键, 由于企业IT运维管理过程的职责不清及体系不健全, 所以导致企业各部门经常出现互相推卸责任的现象。

1.3 运维管理的流程缺乏保障体系

企业的IT管理部门不仅要确保企业信息系统在运行时的安全、稳定及可靠, 还要利用强大的信息系统为业务部门的各项决策提供有效地支持。但由于IT管理人员往往会出现为了处理突发事件, 从而忽视了主动服务的现象。

1.4 运维管理缺乏长期的规划

大部分企业的IT运维管理由于偏重于对“硬平台”的建设, 忽视了“软平台”的管理和维护, 导致运维工作人员在客户满意度考核中评价较低, 而相关部门的责难也会打击工作人员的积极性。尤其企业网络建设缺乏这种长期的规划和对于复杂IT系统的运维管理经验, 导致企业IT运维管理停滞不前。

2 提高企业IT运维服务管理能力的有效措施

2.1 在ITIL视野下建立适合企业的IT运维架构

传统的运维管理架构相对于IT运维管理架构来讲相当简单, 其在碰到运维方面的问题时由运维负责人分配工作, 这样的运维方式在企业初期阶段简单高效, 但随着企业规模的不断扩大, 以及计算机信息技术的普及应用, 传统运维模式就会受到耗费人力、物力, 并且处理问题的效率也较低以及工作量比较大等不利的因素影响, 所以, 企业为了能够高效率的运维管理, 就需要改换为新的IT运维模式。IT运维管理有三个优点, 第一, 其不但为企业提供了稳定、高效、可靠的网络管理平台, 而且也为企业的各个应用系统的正常运行提供了强有力的保障。第二, 能够快速解决客户端的运维故障, 为客户提供了满意的服务。第三, IT运维管理在为企业节省人力的同时, 提高了处理网络故障的工作效率。基于IT运维管理的这三个优点, 所以企业在IT运维管理方面不断寻求创新以及不断提高要求。

其次, 企业的领导需要结合ITIL思想的指导作用, 建立相应的信息化工作领导小组, 并且其小组的成员必须是企业信息化职能部门, 专门负责IT运维管理的决策管理与协调所有IT运维的工作。

2.2 建立职责相应的奖惩制度及运维工作考核标准

企业各部门的岗位工作方式都不相同, 有的员工做着现场维护的工作, 有的干着远程处理的工作, 所以, 不同岗位的工作所承担的责任以及所享受的待遇也不相同, 但是, 企业要给予员工在职责和待遇方面要与其职位相应, 因此, 企业应当推出与工作职责相应的奖罚及晋升制度, 以激励员工的成长进步。其次, 由于IT运维管理的各个岗位的工作方式不一、技术水平不同, 因此要对运维人员的工作进行量化, 并通过一系列分析运维数据制定严格的考核标准, 激励员工不断提高服务水平和服务质量。

2.3 企业结合组织节后, 建立并明确运维管理的流程

传统运维管理模式对企业IT部门是按应用开发、网络管理以及系统控制等专业进行工作划分的, 其工作也是按照水平层面进行管理的。但是新的IT运维管理系统则是按照专业和技能对企业各部门进行工作分工的, 比如, 一线专门负责解决处理IT运维管理中最基础的问题, 二线则负责解决处理IT运维管理中最难、最复杂的故障, 而经理则需要对IT运维管理进行全面把握和疑难问题的解决。这样根据企业的实际情况, 对结构进行优化, 建立各个系统的的运营架构, 使各个部门既相互独立, 又互相联系。企业只有对组织结构进行调整, 明确企业IT运维管理的具体流程, 即使企业的IT系统出现了问题, 仍难能够第一时间联络相关负责人, 解决问题。

2.4 建立IT运维各系统的管理办法

IT运维管理模式和设备预知维修模式一样, 同样注重预知维修。IT运维管理模式也能够根据监测系统和日志记录系统发现异常现象, 并且能够通过检测系统将故障在萌芽的状态下解决。现代企业管理比较依赖于IT运维服务管理模式, 所以对IT运维服务管理模式的要求也不断提高, 比如, 某大型企业的MES、ERP、IC卡等应用系统, 要求必须实行二十四小时工作, 如果不实行实施工作, 那么如果某一个应用系统中出现任何一个小故障都会给企业造成巨大的经济损失, 因此, 降低信息系统出现的故障率对于企业来讲是非常重要的。

2.5 建立并且完善IT运维服务管理各系统的文档资料

由于网络的不稳定性, 即使企业IT运维服务管理各系统的资料再详细, 也有出现故障的可能, 故障处理不好的话还会导致数据丢失, 而维护好文档资料对IT运维服务管理工作有着重要的意义。文档资料在整理的时候除了要清晰、全面, 同时还需要满足“动态更新”和“高质量材料”两个原则, 如果资料的动态没有得到及时的更新, 对事情对产生不利的因素, 影响对事情的判断;一份高质量的资料能够让一个新人在完全不了解公司情况下, 通过资料能清晰的了解公司的现状, 因此建立并完善的各系统的文档资料管理对于IT运维管理非常重要。

3 总结

多数企业为了实现优化生产程序、提高工作效率以及减少对管理的成本, 都选择使用IT运维服务管理模式, IT运维服务管理模式, 在帮助企业实现以上要求的同时, 企业也对其提出了更高的要求标准, 企业IT运维服务管理模式既要有一个完整、清晰的运维架构及合理的工作流程, 同时更要注重企业的管理工作及制度, 只有这样, IT运维服务管理模式才能够更好的服务企业。究竟未来的IT运维管理会得到怎样的发展, 我们不得而知, 但是不可否认的是, 我国企业的运维管理意识还有待于普及, 相信而随着信息化进程的快速发展, IT运维管理一定会有广阔的发展空间。

摘要:IT运维服务管理与普通的系统维修、排除系统故障等工作不同, IT运维服务管理的核心价值在与为企业提供最优质的服务以及帮助企业实现精益化管理。随着计算机技术的快速发展, 信息技术开始被各行各业广泛的运用, 从简单的计算到初级办公, 再到深入与企业应用系统的各方面, 致使企业在日常的工作中对IT运维服务管理有着极大的依赖性, 因此, 企业对于IT运维服务管理的稳定性、安全性及可靠性有着越来越高的要求。据此, 基于ITIL构建IT服务管理体系的现状做出简要的阐述, 并对进一步优化企业IT的运维服务管理提出了一些建议。

关键词:企业,IT运维,管理模式,研究,策略

参考文献

[1]徐健, 孙永.基于ITIL构建企业IT运维服务管理体系[J].微型机与应用, 2014, (10) :97-101.

[2]刘雁.基于ITIL的A公司运维服务管理研究[D].南京:南京邮电大学, 2014.

运维管理标准 第5篇

概述

运维是管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于运维部门内部日常运营管理,涉及的对象分成两大部分,即业务系统和运维人员。其管理内容又可细分为七个子系统:

第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;

第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复; 第三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理 第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;

第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;

第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;

第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

第一章 总则

1.为加强公司各个项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,特制定本规定。

2.实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。

3.完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。

4.本规定适用所有进入运维环节的项目。

5.运维人员应根据授权,处理本规定中所涉及的业务事项。

第二章 主机、服务器及数据库系统的运维管理

1.根据应用需求,主机、服务器及数据库系统的配备和安装、以及系统资源的使用等由公司项目实施部统一规划。

2.应指定专人作为系统管理员(系统工程师)和数据库管理员,对系统的运行、管理、维护和安全负责,并按照有关规定负责系统和数据的备份与恢复。3.系统/数据库管理员应定时对系统进行监控和定期的健康性检查,分析系统运行和资源使用状况,并进行必要的优化、调整和修正,及时消除隐患。如系统设置发生变化,或重新安装系统,或安装了新软件,应在此后15个工作日内对系统进行密切跟踪。

4.及时解决处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度地保护好系统资源和数据资源。

5.对于重大软硬件系统故障,应立即通知部门领导,协调服务商,使系统尽快得以恢复运行;对于应用系统引发的系统异常或故障,应及时通知相关人员,并协同解决处理。

6.每季度应对系统主机/服务器/数据库进行一次停运维护,其操作必须严格按照操作规程进行。其他非正常性停运(故障引发的除外),应提出书面申请,并经部门领导批准后方可进行。同时做好相应的准备工作,最大限度地减少对业务操作带来的影响。

7.具有系统操作或管理权限的人员调离工作岗位或离职,应立即从系统中删除该用户;如该人员掌握超级用户口令,应立即更换口令。

第三章 软件系统的运维管理

1.避免在用户工作时间进行软件版本升级工作,以免由于人为失误造成业务中断。2.软件系统的安装、升级等操作应保留完整的实施记录。

3.对软件系统进行升级、更新补丁,应首先进行相关的测试,并在确认无误后实施。

4.对软件系统进行升级、更新补丁,或进行系统的重新安装等操作,应在实施前对原有系统及数据进行备份。

5.变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留。

6.软件进行版本升级时,对于不影响业务的升级工作,须以书面形式详细将计划、方案、措施等报上级主管部门备案;对于影响业务的升级工作,必须提前两周向上级通信主管部门以书面形式提出申请详细报告计划、方案、措施等,经批准后方可实施。

7.维护人员应定期跟踪所使用系统的软件升级情况和升级后的新功能,必要时提出升级建议。

第四章 数据库的运维管理

1.对于数据库的变更必须有记录,可以回滚。2.无用表和字段要及时清理。

3.从数据库删除数据一定要先备份再删除。

4.定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据。定期检查备份的执行情况,确保备份操作正确执行。5.指定专人定期进行备份数据的恢复性试验。

1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详细的操作记录;

2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,必须提前与客户方进行沟通,避免操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成一致后方可实施。

3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

第五章 巡检管理

定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。

1.对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例

行巡检、节假日和重要事件前的巡检

2.维护人员应根据工作计划,对维护的设备定期进行预防性巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要认真做记录。

3.巡检过程中发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程

4.所有的巡检都应有详细的记录,包括时间、巡检情况和责任人,并应在巡检纪录卡上签字。

第六章 网络管理规范

 关键业务流程

对以下业务系统流程监控,对业务系统是否正常运行、各项具体参数指标是否超标等进行掌控,避免或降低业务系统故障的发生率。

1、单位内部的关键业务流程。

2、网络吞吐量大的业务流程。

3、对系统造成大的压力,频繁使用数据库的业务流程

4、同其它系统集成的业务流程,这些集成会提高应用失败的风险。 用户体验同系统性能指标相关联

将网络中的所有网络基础架构都进行集中监测,包括对数据库服务器、应用服务器、路由器、交换机、防火墙的监控,收集网络运行信息,将性能数据同单位内部用户的体验相结合来分析网络的性能状况,诊断系统瓶颈。

 建立网络运行基准指标并观察趋势

长期监测并通过对网络运行的观察,分析网络性能的变化和流量等指标的运行趋势;及时发现网络偏离系统基准模型时的异常状况,分析故障,达到预警的目的,防止更严重问题的发生。 设计报警策略,避免警报泛滥

配置报警的依据是根据信息服务管理网的网络运维管理目标,报警设置的原则:

1、对影响网络和业务的重要指标设置报警;

2、消除误报和重复报警;

3、报警应该以多种方式及时发送给相应的负责人。 创建自动化、规范化事件处理程序

信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行出现问题时能够有自动化、规范化的处理问题程序,快速处理各种潜在故障并且分配到相应的负责人,提高工作效率。另外可将工程师长期积累的知识和工作经验系统化和固化,达到快速定位故障的目的。

 网络服务质量SLA的量化管理 提高网络服务质量的设立量化指标,将其作为整个网络运维管理团队的整体目标。信息服务管理网网络性能管理的总体目标包括网络和设备、业务的可用性、网络的吞吐量、带宽使用百分比、网络延时、CPU和MEMORY的负载,对于不同的网络指标还要根据网络的上下级连接关系分解到每一个子指标,作为对网络故障诊断和性能管理的依据。

 制定网络的升级和改进策略

网络的升级和改进应该以对现有网络和系统性能数据的测量为前提,以对网络整体运行的现状及趋势分析为依据。通过对单一网络系统和整体网络系统性能数据的比较、单一网络组件和其它网络组件的数据比较、系统负载量最大时的性能数据和一般负载时的性能数据的比较等,判断是否需要对系统的局部或者整体进行升级,发现网络系统性能的瓶颈,提出网络系统改进的方法。 日常规范

1.每天两次进行业务系统、网络运行状况、业务流量及对外服务器服务状况监控巡查;

2.按照规定的时段巡统计并汇总运维表单。(流量统计、事件统计、问题统计、手里投诉统计等)按照规定的时段查看路由、防火墙等关键系统运行情况,包括网络流量、带宽占用率等,重点检测关键设施,并记录;

3.处理产品组网络问题应做完整、详细记录,快速响应,及时确定原因,积极组织处理,同时记录解决问题的操作过程,问题解决后应及时回复;

4.对网络资源调配管理(ip资源分配、设备端口划分、链路传输、负载均衡等)、核心和汇聚层等核心网络运维的调试,做好汇报申请并记录。

5.故障分析及处理,网络拓扑更新及网络优化。网络安全方案实施部署,更新维护录入知识库。

6.处理各种网络故障,并作记录,保障网络正常运行。7.遇到不能处理的问题时,通知相关人员或及时汇报,并记录;

8.工作人员要有强烈的安全意识,巡查时应注意发现各种可能的安全隐患并及时排除。

第七章 请示报告制度

为加强相关信息处理和反馈管理,有效的控制系统和设备的运行状态,通过规范的请示报告流程,提高运行维护的管理效率。

例行性请示报告

1.按照规程和制度规定的周报、月报、季报和年报。2.系统升级、交接和重大数据变更请示报告。3.各类专项请示报告和合理化建议。紧急性请示报告

论企业信息系统运维体系的构建 第6篇

【关键词】运维体系;系统构建;信息系统

0.引言

人类社会的进步,科学技术的发展,使的各行各业都取得了前所未有的成就。新世纪是信息技术快速发展的时代,数字化、信息化、网络化是新世纪的代名词,科学技术的进步,加大了人们对信息化的高要求,同时也推动了信息化系统管理的新步伐。与国外相比,国内企业信息化系统运维体系逐渐由不成熟走向成熟,但必须承认的是信息系统运维体系是企业发展的必然趋势。在未来发展的过程中,信息系统运维体系将会得到的标准化和规范化管理,同时也会对运维体系的构建提出更高的要求,与更大的挑战。因此,研究信息系统运维体系的构建,是电力企业当前必须重视的问题,从而使电力行业快速的的适应社会发展的需要,促进电网企业信息系统的良好发展,缩短与社会发展同步的差距,增大行业的竞争力。

1.电力企业信息系统运维体系的概述

1.1企业信息系统运维体系的关键

运维管理人员组织是企业信息系统运维体系的关键,不同技术的人员负责不同的工作,相互协调配合,发挥各自的作用,从而共同实现系统的功能。除此之外,运维人员必须遵守基本准则。例如运维人员要求明确自己的职责以及相应的工作流程;需要对运维人员进行定期评价检查;加大对运维人员的培训工作,从而提高工作效率;要调动运维人员的积极性,检测诊断信息系统,并且及时解决问题。

1.2企业信息系统运维体系的根本

规范管理是企业信息系统运维体系的根本,只有按照流程与制度,才能顺利的完成信息系统的运维。结合企业自身实际情况,制定相应的运维体系,并将运维体系制度化规范化,从而确保制度的运行。

1.3企业信息系统运维体系的重要环节

系统用户反馈是企业信息系统运维体系的重要环节,用户的反馈使运维管理目的变得更加明确,能够使用户发挥主动性,对整个系统起着重要作用。

2.当前电网信息系统运维管理的现状

随着企业信息量的加大,对信息系统运维管理提出了更高的挑战。我国电力企业经过近几年的发展,信息系统取得了一定的成绩,但还存在一些问题。

2.1基层技术力量薄弱

当前电网系统出于安全稳定的考虑,常常忽略基层维护人员,而是交给其他技术人员完成,其后果严重影响了工作效率,使基层人员技术得不到提高,导致基层力量薄弱,不利于电网企业信息系统的整体管理。

2.2体系不健全

当前运维管理没有健全的模式,导致人员分工不明,任务不均,造成技术人员任务过重,而其他部门没有及时参与,从而降低了工作效率;信息化建设相对泄后,各功能较分散,存在多次建设现象,从而不利于一体化的运维管理;缺少数据质量监控手段,不能对数据进行提前预警,从而造成人力物力的大量浪费。用户反馈机制落后,没有及时解决用户问题反馈,缺少主动性,降低了运维管理的工作效率。

3.针对信息系统运维体系问题的改进措施

3.1完善信息系统运维体系

良好的体系,能够提高工作效率,能够使各部门运维管理人员了解自己的责任与存在的问题,及时分享工作经验。要建立运维数据库与监控中心,为运维管理工作提供一个有利平台,从而有利于整体性的提升人员技术水平,为开展下一步运维工作奠定了基础。

3.2规范信息系统运维体系的管理

要加强制度建设,对信息系统运维体系进行规范的管理,不断完善数据质量安全保障制度,确保运维管理各项工作平稳的开展。对于运维工作人员要合理的安排岗位,对运维人员操作熟练度进行检测,根据其结果合理安排岗位。除此之外,要设置问题汇总岗位,及时处理基层人员与用户问题反馈,总结汇报给上级单位,从而有利于运维管理工作的高效进行。

3.3增加对运维管理人员的培训

加大对运维管理人员培训力度,要对具体模式的特点,进行针对性培训,特别是对基层人员培训力度加强。定期开展讨论会,相互交流总结经验,并调动运维管理人员的积极性,要对技术创新的人员进行鼓励。

4.结束语

信息系统运维体系的应用,实现了对电网企业信息的管理,有效提高了企业的工作效率,并将引起电力行业的巨大变革。此外,信息系统的安全与稳定是企业高效运行的关键,并且为电力企业提供了一个发展平台,使得电网企业信息化系统管理更加标准化和规范化。面对逐渐增多的信息数据量,对系统运维管理提出了更高的挑战。信息系统运维体系的发展前景还很广阔,将来还会带来更大的突破,从而为电力企业带来更多经济效益。我相信随着信息系统运维体系的进一步的发展,我国的电力行业将进入一个新的阶段,会给我们的生活带来翻天覆地的变化。 [科]

【参考文献】

[1]徐晖.在数据集中模式下电网企业信息系统运维管理初探[J].电力信息化,2009,03.

[2]赵希超.企业信息系统集成模式研究[J].电力信息化,2009,10.

[3]黄俊强,麻厚涛.网络运维与系统建设的并行关系[J].信息技术,2011,02.

[4]吴顺成.企业信息系统运维模式的探索[J].福建电脑,2011,11.

企业运维管理论文 第7篇

业务服务管理 (Business Service Management, BSM) , 是IT运维管理的高级阶段, 强调从实现企业业务价值的目标出发, 以业务的视角看待IT管理, 最大限度地发挥IT对企业业务的推动作用。在此, 探讨利用BSM改进供电企业的IT运维管理体系及其运维架构, 并对支撑BSM的IT运维支撑平台的总体设计进行了介绍。

1 IT运维管理现状

当前, 国内供电的信息化建设正步入高速发展的时期, 随着营销、生产、财务以及人力资源等主营业务系统的逐步统一, 信息化建设按上级公司的规范化方向发展。如在广东电网公司系统内, 核心和主要业务系统的建设均由省公司主导、全省统一版本, 数据基本采取省集中或者地市集中模式。目前, 省公司和各地市供电局信息化运维服务体系建设, 基本处于起步阶段, 虽逐步建立了与运维服务体系相关的平台系统, 但运维体系却仍然沿用过去分散和杂乱的模式, 已经明显跟不上信息化建设的步伐。

汕头供电局是广东电网公司下属机构, 已陆续建立了网络、主机系统、信息安全和机房等各种监控管理系统, 并采用了IT服务管理软件作为流程流转和信息共享的平台, 实现了服务台管理、配置管理、变更管理和问题管理, 初步完善了IT基础架构监控, 统一了IT服务入口和规范IT服务流程。

目前, 汕头供电局所建的IT监控系统和IT服务管理系统基本上以面向设备为主, 没有直接面向业务。在面向设备的运维模式下很难从整体上对业务系统可用性和健康状况进行实时评测, 难以了解用户体验情况, 无法对基于用户的业务服务水平进行量化评价和分析, 造成运维工作长期处于被动局面, 已经不能满足日益扩展的运维管理工作的需求。因此, 整合现有各类监控系统, 强化运维分析功能, 实现面向业务应用的集中运维已显得非常必要和迫切。

2 利用BSM改进供电企业的IT运维管理

2.1 升级BSM的可行性

IT运维/服务发展经历了网络服务管理 (Network Service Management, NSM) 到IT服务管理 (IT Service Management, ITSM) , 再到BSM的变革。目前绝大多数供电企业都已经实施了ITSM, 关注点不再是选择何种网络管理工具, 而是什么样的IT运维工具能够真正提高IT运维的效率, 实现企业网络利用率的最大化。

相比NSM和ITSM, BSM的优势在于:BSM的主要功能是实现IT资源与其支持的业务服务之间的动态映射, 让IT部门能够将基础设施事件与业务成果关联起来;BSM能够整合各个层次IT资源的事件和状态, 让运维人员能取得业务服务的性能、用户体验和服务水平等具有直接业务价值的信息;BSM提供对服务的业务影响看法, IT部门可以根据服务资产的业务影响衡量这些资产的价值, 帮助IT部门作出正确的业务决策, 图1显示了BSM与IT基础架构和业务服务的关系。

与ITSM相比, BSM更注重业务服务质量和用户体验, 其IT运维管理的目的更倾向于实现业务价值。BSM是建立在ITSM更高一层的IT运维架构, 与原有的ITSM并不冲突, 可以保留现有的基于ITSM的IT运维系统, 通过升级改造实现BSM目标。

2.2 实施BSM的目标和步骤

根据汕头供电局目前的IT运维现状和存在的问题, 对BSM实施的目标设定如下:

(1) 整合和补充完善现有IT资源系统, 实现对监控事件和状态的统一推送和综合利用。

(2) 建设一个强大、实用的运维分析系统, 实现故障隐患和关键指标的有效监测, 让运维人员能够把精力从事后处理转为事前预防, 最大限度地提高业务应用的服务水平。

(3) 理清IT资源和业务应用之间的依赖关系, 提供业务服务建模和图示化的关键指标展现, 实现IT与业务的融合。

(4) 构建一套科学的服务水平管理体系, 实现服务水平的定义、评估、告警和分析, 确保IT运维目标的实现。

(5) 从面向业务的角度出发, 解决IT集中运行监控系统未能覆盖的监控需求。

(6) 解决集中运维场景下信息的统一调度和信息推送。

面向BSM的IT运维比基础的IT运维提高了一个层次, 具有较高的技术要求, 考虑到该项目的实施复杂度, 以及与省公司IT服务运维项目实施的一致性, 在本项目的实施进度上采用分期建设模式:

第一期工作重点是以电力营销相关业务应用为核心, 围绕其对原有的网络、主机、系统平台、机房和门禁等各种监控系统进行整合和扩充完善, 实现面向业务应用的监控整合、智能分析、故障预警、信息推送、用户体验管理和服务水平管理功能。

第二期的工作是把业务服务系统扩展到企业的所有关键业务服务, 并建立覆盖各个县级子公司的两级运维业务服务支撑体系。

2.3 实施方法

考虑到汕头供电局目前已经实施了较为完善的运维系统, 为了保护现有资产、降低升级成本, 采用ITSM向BSM平滑演进的实施模式。如图2所示, 对现有的运维/监控系统在界面、数据、事件分析上进行整合, 并增加用户体验监控;利用整合数据进行业务服务映射, 形成业务服务统一展现、业务服务水平分析和业务服务影响分析。

3 面向BSM的IT运维支撑平台的总体设计

3.1 总体架构

面向BSM的IT运维支撑平台总体架构如图3所示。

(1) 应用管理。提供具有故障分析和预警能力的应用监控管理。以业务视角组织和展现运维对象, 并按业务需要提供监控结果。BSM要求事后处理向事前维护转变, 变事后被动修复向实时监测主动维护, 因此监控平台需要具备事件关联分析能力。

(2) 用户体验管理。发现业务服务在功能点和地域之间的差异和优势, 发现潜在隐患和快速定位问题。用户体验管理系统可以解决监控死角问题, 并在发生故障的应用系统对用户产生不良影响之前进行预警。

(3) 监控整合。提供对多来源、跨专业的事件进行分析、加工、压缩、过滤、展现和推送机制, 实现监控信息的综合利用。

(4) 智能信息推送。IT集中运维导致不同地域、不同机构的运维人员都需要准确了解运维信息和故障告警, 因此, 需要一套统一推送机制实现包括短信、看板、声光、桌面以及邮件等多种形式的信息推送方式。另外原厂商和集成商也需要订阅不同运维中心相关的告警信息, 能够加快解决故障的速度。

(5) 服务水平管理。提供服务水平目标设定、监测、评价、预警、分析与报告功能, 确保业务服务质量符合客户期望。服务水平管理能够客观科学地反映运维质量, 通过服务水平管理让IT部门关注客户需求, 有效地履行服务承诺。

3.2 关键技术

在实施面向BSM的IT运维支撑平台过程中, 必须解决多个关键技术, 确保该平台能够与BSM运维体系相适应, 确保新增投入的有效性。

(1) 上下文关联分析引擎 (CCE) 。CCE是一个支持并发分析的多线程分析引擎, 负责对采集插件上报的报文进行加工、处理、分析和判断, 并把分析出来的指标监测结果存储到数据库中。CCE是一个规则驱动的分析引擎, 规则驱动技术与过程驱动技术相比可以大大降低分析脚本编写的难度, 使非专业开发人员也可以自行修改或者编写分析规则。

(2) 浮动阀值支持。由于很多监控指标不能根据单一设置的阀值进行分析处理, 所以分析规则需要根据不同的时段确定不同的阀值范围。例如CPU的负载监测可能要在上班时间设置一个阀值范围, 非上班时间设置另一个阀值范围。对于这一情形系统必须提供时段阀值范围定义功能。

(3) 防抖动设计。指标防抖动设计是为消除“瞬时出现故障又很快恢复正常”这种现象而特定设计的。指标抖动现象是IT设备运行中经常出现的问题, CPU负载、内存利用率等就是这种经常抖动的指标。

(4) 采集依赖分析。采集依赖是在数据采集阶段的一种分析技术。在网络上互相连接的多个设备之间, 当一个节点设备出现问题, 下边连接的设备都将不可访问, 通过采集依赖分析技术, 可以直接定位出现问题的节点设备, 同时, 对其下连接设备的所有错误信息进行屏蔽。

(5) 业务依赖分析。各种IT资源之间都是相互依赖的, 尤其是业务系统的IT资源依赖更加紧密, 使用业务依赖技术可以准确地对多个具有业务依赖关系的IT资源进行故障定位。例如:对Oracle数据库表空间的监测, 在表空间被设成自动增长的前提下, 主机磁盘剩余空间不足就会直接导致表剩余空间的不足。当表空间不足的时候, 通过业务依赖分析, 就可以分析出是主机磁盘空间不足还是表空间不足。

(6) 系统安全机制。监控过程中有大量的数据交换, 同时不同身份的用户也需要通过网络对运维平台进行管理, 因而必须使用数字签名和加密等技术, 保证数据的安全交换以及用户的身份认证和授权。

4 结语

IT系统生命周期包括IT系统开发和运维两大阶段, 随著IT系统的大规模建成和投入运行, IT运维越来越受到前所未有的重视。相比IT系统开发, IT系统运维不仅时间跨度长, 而且IT运维质量直接影响到业务服务的质量。对于供电企业, 由于业务复杂、信息化水平较高, 其IT技术架构也日趋复杂, 一个业务应用通常跨越多个IT资源层面, 传统运维模式已经很难满足企业要求, 选择合适的IT运维管理工具就显得非常必要和迫切。汕头供电局针对面向BSM的IT运维管理架构及其技术支撑平台进行了大量调研, 拟采用对现有基于ITSM的运维体系向BSM体系平滑升级的方法来解决现有运维模式所存在的问题, 实施初期已获得了一定的效果。下一步的工作是完成面向BSM的IT集中运维分析系统的建设, 并从“规范化、体系化、指标化”角度出发, 制定行之有效的面向BSM集中运维的技术解决方案和实施方案, 规范和指导IT运维人员开展工作。

摘要:目前, 供电企业普遍实施的面向设备的IT监控平台, 无法从整体上对业务系统的可用性和健康状况进行评测, 难以保证IT运维的质量和服务水平。从解决这一问题入手, 阐述了如何利用业务服务管理 (BSM) 理念对供电企业的IT运维架构进行改造, 将IT运维提升到BSM的高度, 以业务的视角看待IT管理, 最大限度地发挥IT对企业业务的推动作用, 同时也对面向BSM的IT运维基础支撑平台的总体设计进行介绍。

关键词:IT运维,业务服务管理,IT监控,供电企业

参考文献

企业运维管理论文 第8篇

关键词:信息系统,运维管理,考核评价

近年来,炼化企业通过运用信息技术在企业生产、经营和管理等方面取得了较大提升,有效增强了企业的核心竞争力。随着企业信息化的不断发展,各种信息系统应运而生。各系统的运行状态对企业生产运行、经营管理、安全防范等方面都有直接影响。因此,信息系统运维如何管、怎么管,成为摆在运维人员面前的难题。笔者结合自身运维的经验,在分析当前信息系统运维管理的现状及其出现问题的基础上,提出更有效的信息系统运维管理方法、措施及建议。

1 当前信息系统运维管理现状分析

1.1 信息系统的分类

近年来,炼化企业根据自身规模与实际发展情况,已开发建设各类信息系统以满足企业需要,根据建设对象的不同大体分为统一建设和自主建设两类。统一建设一般是集团型公司统一立项、设计、开发建设的信息系统,由子公司做推广实施应用,其信息系统服务器在总部。自主建设则是公司自己出资进行规划开发建设的信息系统。

1.2 信息系统的运维内容

运维内容指信息运维部门通过一定的管理和技术手段,对系统软硬件维护、数据、安全、性能、用户、制度与规范等进行综合管理,同时为用户提供服务与技术支持。

1.3 信息系统的运维模式

当前,各公司信息系统运维的组织机构一般是由信息部门来担任。统建系统通常采用三级运维模式。自建系统运维模式一般分为内部运维、外包运维和混合运维三种模式。内部运维主要是由企业内部运维队伍承担运维工作。外包运维则是将运维工作交由外部专业技术公司来承担,定期支付给外部技术公司一定的服务费。混合运维是上述两种方式兼有。自建系统的三种运维模式各有所长,企业可根据情况选择。

1.4 信息系统的运维管理手段

根据公司规模及公司在信息化方面投入资金数目不同,信息系统的运维管理手段大体包括制度管理、热线帮助(有的公司叫呼叫中心)、IT平台、问题反馈平台、系统监控等。制度管理指的是公司按制定好的制度强化运维管理;热线帮助则是直接面向用户的咨询方式,具有直接和快捷的特点;IT平台则是当前众多公司选用的运维管理系统;问题反馈平台是用户将问题提报,运维人员线上解答,是收集用户问题的一个手段;系统监控平台一般是用于大型系统或者机房监控设置,发现问题以短信等方式发送给运维人员。有效的管理工具和技术手段是实现运维管理自动化、专业化的技术保障。

1.5 信息系统运维中存在的问题

运维人力资源方面。随着信息技术在企业的深化应用,各种业务应用不断增加,服务用户也相应增多。因此需要更多的专业化人员参与运维工作。有的公司运维人员紧缺,难以满足工作生产的需要;有的公司运维人员经验不足,有些公司基层技术力量薄弱,这些问题制约了运维管理工作水平的提升。

运维组织结构方面。有的公司组织机构不明确,有的公司组织机构虽然庞大,但在实际运维过程中大部分运维工作仅靠个人来完成,这些都不便于运维管理工作的有效开展。

运维制度方面。有的公司存在现有制度不规范、不系统,缺乏科学合理的规划;有的公司现有制度执行力度不够;有的公司存在各系统制度独立,没有统一的管理约束。这些都不利于运维管理工作。

运维工作量方面。有些公司当前信息系统是分散管理,各系统运维工作量不同,势必会造成运维人员工作量存在不均衡。如果没有有效的工作评价和考核机制,就会造成运维人员主动性低,运维效果差。

运维的技术手段。很多公司运维技术手段单一,有的虽然有专门运维网站,能起到交流作用,但是网站还有其局限性。因此,只有构建一个综合技术平台,才能提供有效技术支持。

2 提升信息系统运维管理效率的措施

通过上述分析,笔者提出构建集中的信息系统运维体系,实现企业信息系统运维管理的高效、稳定和安全,充分发挥运维管理在企业信息化过程中的重要作用。

建立集中的信息系统运维体系,就是有效利用管理、服务、安全、制度、考核评价等体系和先进的技术手段,实现对信息系统的运行监控、数据维护、系统完善、完全保障等工作,促进信息系统运行维护的有效性、规范化、标准化和系统化。

2.1 建立有效的运维管理体系

要建立有效的运维管理体系,应依据公司信息系统运维管理规范,制定帮助热线、监控、时间和服务请求、问题、变更、配置等运维规范;制定信息系统应用与维护管理细则;设立运维组织;制定覆盖运维工作各环节的操作流程。要做好运维管理工作,就必须从全局的角度整合运维资源,明确运维服务的工作内容,通过定岗定员定机构,明确组织机构和人员职责分工,构建有效工作机制。在机构设置上也要保证责任全覆盖。另外,还要建立运维人员的培养和激励机制,提升人员的组织管理、应急响应和处置能力。最后通过统筹管理和共享资源,加强系统运维沟通协作,建立有效的管理体系,提高运维的有效性。

管理规范是管理流程执行的保障手段,因此需要制定统一、标准的运维管理规范。在制定规范的过程中,首先要找出系统的共性,使其适用全部系统。然后再根据各系统的特殊性,明确特殊环节的要求,满足系统的差异性。通过自上而下统一协调、统一管理,提高运维的规范化。

运维管理体系,是开展运维工作的前提,有效的管理体系将使整个企业的信息系统运维工作事半功倍。

2.2 建立完整的运维服务体系

建立完整的运维服务体系,首先要合理规划人员与技术资源,建立合理的业务模型,通过对运维人员、流程及技术的管理和控制,不断改进服务过程,提升服务能力,积累企业支持。然后综合运用当前先进技术手段建立一套功能完善的信息系统运维管理系统。最终通过统一平台实现:①帮助热线及呼叫中心的实时进行工单接收、问题分析、工单分配、过程监控、工单确认、服务评价、服务考核等全过程集中管理;②网络、服务器、数据库的可视化统一管理;③机房电力、消防等动环设备的实时监测,节约人力,极大提升运维效率。运维人员也通过知识共享、互学互助,扩展自身业务领域,挖掘自身潜力,提高协同运维能力,保障系统安全、稳定运行。

完整的运维服务体系能保证运维工作更高效、更协调地开展,提升运维服务质量和服务管理水平。

2.3 建立完善的运维安全体系

运维人员在做好信息系统基础运维工作的同时,还应保障系统的软硬件及数据安全,加强风险识别和防范能力,提前预估可能出现的风险;掌握集团公司系统安全管理规范,对负责的系统进行合理的安全基线配置;针对较高的风险制订应急措施,保障信息系统安全。此外,企业应通过定期组织应急演练及对演练的结果进行总结分析,来增强运维人员处理突发事件的应急能力。另外,还可通过当前先进技术手段,建立安全保障系统,提高信息数据的采集、存储、处理等各个环节的安全性,逐步形成稳定的运维安全体系。

完善的运维安全体系能有效预防各类事故发生,减少突发事件带来的无法预估的工作量和影响。

2.4 建立完善的运维制度体系

根据各系统共性,建立统一的制度,统一管理,规范运维。再结合各系统特殊性,制定相应的实施细则,细化运维工作。通过不断的完善和细化,形成制度体系,使运维工作按流程、有痕迹、可审计,形成统一的运维管理制度体系,实现运维管理的标准化。

2.5 建立规范的考核评价体系

建立规范的考核评价体系,首先,要制定考核和评价指标,分层次比照,增强考核与评价的有效性。其次,要建立考核和激励机制,对运维人员进行评价检查,进步给予奖励,失误则给予惩罚,充分调动运维人员的积极性,及时发现问题,消除潜在隐患,进一步提高运维管理水平。

考核不仅仅是评价和监督,更是对员工的激励,完整的考核评价体系能有效发掘员工的潜能,提升业务能力和技术能力,提升整体运维水平。

3 结语

做好企业信息系统运维工作,对于企业发展至关重要。随着信息技术的发展,企业信息系统运维工作将更要不断总结、研究和探索,通过建立高效、稳定安全信息系统运维体系实现企业信息化的长远发展。

参考文献

[1]刘希俭,古学进,王同良,等.中国石油信息化管理[M].北京:石油工业出版社,2008.

浅谈电信企业运维成本对标管理 第9篇

关键词:对标管理,运维成本,电信企业

一、成本对标管理的内涵和作用

所谓对标管理, 简单地说就是寻找标杆, 对比标杆, 找到差距, 有针对性地改进和提高。企业可以选择影响生产经营的重点项目和关键指标, 对照历史或行业最优指标值, 从内部和外部两个方面进行纵向、横向的比较, 从而找到自身的差距, 有针对性地进行改进和提高, 以达到节约成本、提高效率、获取并保持核心竞争力的管理目标。

对标管理源自上世纪70年代的美国公司, 从90年代我国钢铁行业开始初步尝试对标活动, 之后有很多行业和大型中央企业也逐步引入对标管理。2010年2月国资委在《关于认真做好2010年中央企业经营业绩考核工作的通知》中明确提出:各中央企业要根据自身所处行业和企业发展战略, 抓住出资人关注的关键绩效指标, 主动与同行业先进水平进行对标。要通过对标工作, 深入挖掘自身优势, 找出差距, 持续改进, 不断提高经营业绩水平。可以预见的是, 在未来的中国企业发展中, 对标管理通过全方位和全过程找差距, 查原因, 定措施, 消缺陷, 能够推动改变企业管理中的粗放行为, 提高企业生产经营业绩和精细化管理水平, 从而会成为诸多企业重点应用的管理模式。

二、电信企业实行运维成本对标管理的必要性和意义

(一) 运维成本对标管理是解决电信企业运维成本管理难题的有效途径

电信企业是资金密集型企业, 付现成本总量非常可观, 而运维成本一般能够占到全部付现成本的1/3左右。运维成本因其规模大且不直接影响市场份额成为电信企业压缩成本的首要选择, 但日益扩大的通信网络规模又势必带来运维成本需求的增大, 这样就容易出现运维成本被压缩和运维成本刚性增加之间的矛盾。实行运维成本对标管理, 可以协助找准运维成本管控方向, 实现运维成本精准管理, 从而有利于解决管理难题。

(二) 运维成本对标管理是落实降本增效、提高成本竞争力的有效手段

运维成本是电信企业降本增效的主要方向之一。而运维成本降本增效的关键点在于找准成本项目进行管控。根据电信企业运维成本的特点, 成本项目本身绝对值的高低不能成为判断是否成为管控方向的标准。成本高不代表该项目应该被压缩;成本低也不代表该项目不应该被压缩。设计合理的指标体系和科学的对标标杆进行对标管理, 可以找到成本管控点有效实现降本增效。以基站能耗为例, 可以通过单载频能耗进行对标, 如果比标杆水平高, 进一步进行单载频耗电量和电价对标;如果单载频耗电量高, 就从基站环境温度、设备类型等入手解决控制耗电量;如果电价高, 就从转供电改直供电、提高与业主谈判能力等入手解决电价问题。这样借助对标管理做到降本增效有的放矢, 提高管理效率。

(三) 运维成本对标管理是加强基础管理, 提高运维成本精细化管理水平的有效方法

电信企业对运维成本大多采取总量式的粗放管理, 各分公司、各部门按照各自的预算额度进行运维成本总量管控, 这在一定程度上影响了成本效益的发挥。实行对标管理, 参照同行业先进水平或同一企业内先进水平, 进行成本指标对比和分析, 有利于健全和完善一整套运维成本指标控制体系, 并有利于全面深化预算管理, 细化预算单元, 推动落实运维成本管理的目标责任、监督检查、考核奖惩机制, 为运维成本精细化管理奠定坚实的基础。

三、电信企业运维成本对标管理闭环方案

电信企业进行运维成本对标管理, 应该实施包括合理确定对标指标、科学确定对标标杆、准确判断管控方向、制定和实施改进措施、总结分析对标效果、持续优化动态管理等六步进行闭环管理, 这样才能取得实际效果, 不会流于形式。

(一) 合理确定对标指标

对标管理的第一步是要合理确定对标指标, 就是解决“对什么”的问题。电信企业运维成本结构复杂, 成本驱动因素很多, 在对标指标的确定上要遵循以下几个原则:

1. 目标性。

实施对标管理的目的从长远看是为了提高企业的经营管理水平, 但就电信企业运维成本管理来说, 因为成本规模大, 涉及的业务也很多, 一般不同时期和不同战略条件下会有不同的管理目标, 比如推进节能减排、实现运维成本降本增效、提高运维成本精细化管理水平等等。在设置运维成本对标指标时应该根据要实现的管理目标进行相应设置。

2. 重要性。

电信企业运维成本涉及的指标很多, 如果对所有指标进行广而全的对标, 就会出现主次不分的情况, 即通过对标揭示出的问题可能有若干, 但无法辨别重点和非重点, 重点问题被次要问题所掩盖。因此, 在设计对标指标时应该选择对揭示和解决问题有实质性作用的关键指标和重要指标。

3. 可执行性。

电信企业设计的运维成本对标指标应该具有可执行性, 一方面应该立足于自己企业的实际情况进行选择, 不能照搬硬套其他企业的对标指标;另一方面重要对标指标应该细化到可执行层面, 以保证能够根据对标结果进行下一步的精准改善。

(二) 科学确定对标标杆

对标管理的第二步是科学确定对标标杆, 也就是解决“与谁对”的问题。选对合适的标杆进行对标才能取得应有的效果。电信企业运维成本对标选用的标杆应该遵循以下原则:

1. 科学性。

运维成本对标选用的标杆应该结合企业实际情况科学选取。如果选用的标杆太高, 会使企业和员工觉得无论如何努力都无法实现追赶, 从而自暴自弃, 放弃努力;如果选用的标杆太低, 会使企业和员工错误认识自身水平, 从而沾沾自喜, 不思进取。因此标杆应该对企业起到牵引的作用, 即应该选用企业通过改进和提高, 有希望达到的目标值。

2. 灵活性。

针对不同的管理目标, 运维成本对标会涉及多个项目和多个指标。为保证对标管理取得最好的效果, 电信企业应该对指标和标杆分级分类, 结合企业自己各方面的情况灵活采用不同的标杆, 而不宜采用同一水平的标杆去衡量不同的指标状况。

一般来说, 与一般成本对标一样, 电信企业运维成本对标采用的标杆可以是企业内部先进水平、企业内部平均水平、同地区同行业水平、同地区同类公司水平。具体来说, 因为电信企业都是全国性的企业集团, 因此企业内部先进水平一般可以选取指标数值较好的前10个省的指标平均值, 企业内部平均水平可以选取全国31省的指标平均值。考虑到各省经济发展水平等的差异, 对标时还可以采用同一地区电信行业的平均水平和同一地区另一家电信企业的平均水平。针对不同的对标管理目标, 还可以选取与本企业情况相似的其他企业的指标水平作为标杆, 比如上海公司可以选择同为直辖市、经济发展水平近似的北京公司进行对标。

(三) 准确判断管控方向

对标管理的第三步是将企业指标的实际完成值与标杆进行深度对标, 找准真正薄弱环节, 准确判断管控方向, 也就是解决“干什么”的问题。这一步是对标管理的关键环节。对标不能只停留在对出成本指标完成情况与标杆是否存在差距, 而是分层分级, 从总体指标到项目指标到项目构成指标到构成指标涉及到的合同、制度、规范等等一步一步进行深度对标。通过运维成本指标的深度对标, 不仅要找到存在薄弱环节的成本项目, 更关键的是要找到成本指标差异的驱动因素以及影响的业务流程或管理规范, 准确判断运维成本的管控方向。仍以基站能耗为例, 先进行单载频能耗对标, 再进行单载频耗电量和电价对标。如果单载频耗电量高, 就进行基站环境温度控制要求、设备使用类型等的对标以判断耗电量高的原因。如果电价高, 就进行转供电基站类型占比、转供电价格谈判要求等的对标以判断电价高的原因。

(四) 制定和实施改进措施

对标管理的第四步是根据对标指向的管控点, 制定可行的改进措施并加以实施, 也就是解决“怎么干”的问题。这一步是对标管理的核心环节。对标管理能否取得成效, 达到预定的目标, 取决于这一步工作的实施效果。在制定和实施改进措施过程中应该做到五有:有目标 (即一定要围绕对标指向的管控方向) 、有时限 (即一定要设定改进时限) 、有责任人 (即一定要为每项措施指定责任部门和责任人) 、有考核 (即对改进措施的实施效果一定要有考核) 、有反馈 (即对实施过程中的相关进程和效果一定要及时反馈和沟通) 。

(五) 总结分析对标效果

对标管理的第五步是在设定时限结束时及时总结分析改进措施取得的对标效果, 也就是解决“干得怎么样”的问题。这一步是对标管理的必要环节。只有对改进措施的实施效果进行不同方向和维度的评估评价和总结分析, 才能准确获知对标管理的真实成效, 并准确指导下一步工作的正确开展。一般来说, 运维成本对标总结可以采取以下步骤: (1) 计算对标指标在截止时间点的完成情况, 与开始值以及标杆值进行比较, 查看指标本身有无改善; (2) 逐项分析各改进措施的实施过程和实施效果, 实施效果最好能够量化评估; (3) 分析总结对标管理是否带来企业流程、管理体制等方面的转变、创新或改进, 是否可以举一反三, 用于公司其他方面的管理提升。

(六) 持续优化动态管理

对标管理的第六步是持续优化对标指标和标杆, 进行新一轮的对标管理。这一步实际上是保证对标管理能够闭环的重要环节。对标管理应该是一个长期渐进的、不断循环的过程, 应该是一套“确定目标、实现目标、确定更高目标、目标再实现”的循环上升的管理模式。当每一个循环暂时结束时, 企业应根据其下一发展阶段的战略思路、成本管理目标, 重新分析市场形势和成本现状, 对原有的对标指标以及设定的标杆进行评估并优化, 进入新一轮的对标管理中。如此循环往复, 保证企业成本管理水平的不断提高。

四、电信企业运维成本对标管理取得预期效果的几点建议

要保证电信企业运维成本的对标管理取得预期的效果, 建议落实以下方面的事项:

(一) 与定额管理相结合, 保证对标管理的精准性

电信企业的运维成本源自庞大的通信网络, 各项运维成本与相关资源量存在紧密联系。如果能够建立一套完善的运维成本定额体系, 将运维成本总量分解为单价和同口径的资源数量, 并将相对可比的项目归集, 就可以此为基础进行企业内不同分公司、同一级公司内不同部门、同一项目不同合同、甚至同一地区同行业不同公司等多维度的对标, 更加准确地挖掘运维成本管理存在的薄弱环节, 制定并落实有针对性的改进措施, 在为网络运维提供必要保障的基础上, 实现运维成本的降本增效, 提升运维成本的精细化管理水平。

(二) 进行深度对标, 保证对标管理的战略性

对标管理不能只停留在指标本身的高低对比, 要通过指标的对标延伸到指标背后所反映的企业战略思想、管理理念、操作习惯、业务流程等等的对标。电信企业应利用运维成本的深度对标, 梳理运维成本涉及的业务规范和流程, 寻找运维业务管理上的挖潜空间, 为建立健康、稳定、高质的通信网络打下扎实的基础。

(三) 建立绩效机制, 保证对标管理的权威性

要保证对标管理不流于形式, 应建立对标管理的绩效机制, 层层落实责任, 环环相扣奖惩。一方面对标的各项工作实现责任分解到分公司、到部门、到员工, 把发展的压力和动力传递、分解到每一个层级, 把对标赶超的各项关键目标任务、完成时限分解、落实到每个岗位和责任人;另一方面根据责任层级建立奖惩机制, 奖励对标效果好的单位和个人, 处罚对标效果不好或对标流于形式的单位和个人。

(四) 加强协作和信息沟通, 保证对标管理的高效性

对标管理的核心是通过对比找差距, 因此需要了解先进标杆的相关信息, 所以企业要建立畅通的信息沟通渠道, 以便学习其他分公司、部门的先进工作经验;对标工作揭示的问题多是系统性问题或跨部门问题, 因此也要加强分公司、部门之间的协作配合。

参考文献

[1]钱庆华.对标管理:一种简单而有效的管理模式[J].中小企业管理与科技, 2011 (11)

[2]樊建利、王付恩.浅谈对标管理如何在企业深度推进[J].中国外资, 2011 (5)

企业运维管理论文 第10篇

关键词:数据集中模式,信息系统,运维管理

2008年, 国家电网公司提出SG186计划, 进一步推进信息化建设的步伐, 信息化业务的不断上线使得电网企业的数据更加集中, 提供信息服务的软件与硬件种类与数量都不断增加, 电网企业信息系统进行信息运营、维护、管理的要求也越来越高。本文分析了我国电网企业信息系统运维管理现状, 分析了其中存在的问题, 并提出了改善运营管理的措施。

1 电网企业信息系统运维管理现状

纵观电网企业信息系统的发展历程, 信息化的过程经历了由计算机为辅助的独立信息系统到以互联网和跨平台技术为主的基本应用平台的发展。随着信息化的到来, 电网企业信息系统中包含的数据也呈指数级增长, 对现有信息系统的运维管理也提出了更高的要求。

我国信息系统的运维工作主要依托的技术平台为:综合网络管理系统、安全管理系统、桌面管理系统、信息运维流程系统。经过几十年的发展, 我国电网企业的信息系统获得了一定的成果, 但是, 由于这些系统在各个电网企业发展的程度参差不齐、相对分散, 对电网公司日益提高的管理需求已经很难满足。

目前, 运维管理现状可表示为如下:

(1) 电网企业从九十年代初期到现在的信息化过程获得了许多的基础数据, 包括生产、财务、组织各个方面, 这些数据对于现在和将来的信息化系统建设、运营管理都将起到积极的作用。

(2) 现有的信息系统数据整合性、关联度较差, 应用系统存在反复开发的问题, 企业资源的管理没有达到整体性的要求, 各个系统之间联系不够密切。同时系统的类别没有统一, 集成困难。数据的共享性、及时性较低, 不利于电网企业信息系统的运维管理, 也阻碍了电网企业的发展。

2 信息系统运维管理存在的问题

由电网企业信息系统运维管理的现状, 可知在现今数据集中模式下, 现有的管理办法和方式都存在一定的不足。信息化的背景下, 对数据的管理和控制很大程度上决定了信息系统运营的成败, 要确保其能够以最快的速度到达子系统或总系统, 要保证在需要的时候能够得到积极的响应。目前电网企业信息系统运维管理中模式是分散式的, 不够集中, 各系统各单位的数据也没有有效的整合与联系, 缺乏对于整体性的考虑, 同时不同系统之间的标准也没有规范化、流程化, 严重影响了信息系统的效率。这些问题的具体表现如下:

2.1 基层系统运行维护技术力量薄弱

任何系统的建立都应该是呈金字塔形的, 底部作为一个建筑或一个整体的基础是最为重要的。由于对省市电网信息系统中数据的重视, 造成了对基层系统技术力量的忽视, 现有的信息基层系统运维管理的薄弱正如金字塔的塔基一样, 影响着整体的效率, 也限制了基层单位的应用水平和运行质量。在基层电网的人力物力投入远远小于省市级系统, 造成基层系统在硬件上的掉队。同时, 现有的电网系统出于保证数据安全性、稳定性角度的考虑, 时常限制基层维护的维护权限, 而将主要的维护工作交由省市级单位的维护人员来完成。尽管这类举措在一定程度上保证了数据性能, 但其严重影响了维护工作的效率, 同时使得基层工作人员的技术水平不能够得到提升, 技术意识也往往较为落后, 影响了其积极性, 最终造成了类似“富人越富, 穷人越穷”的恶性循环, 完完全全不利于电网企业信息系统的整体运维管理。

2.2 运维体系不健全

2.2.1 没有建立完善的运维管理模式

现有的运维工作由于分工不明确, 基本上所有的工作都是由技术人员来完成, 造成了技术人员负担过重, 另一方面又使得其他部门不能积极地加入到运维工作中来, 大大降低了运维工作的效率。同时, 运维工作中各个岗位的工作人员技术业务水平大不相同, 而企业对运维的管理没有流程可言, 常常使得出现问题时没有合理的组织来处理。

2.2.2 信息化建设和运维未能有机结合

运维工作是和信息化的建设一道进行的, 而电力企业仅仅简单地将企业的信息化过程分为建设、运维过程, 建设信息化的技术人才与运维系统的技术人员分别是两套班底, 当问题出现时使得运维人员并不能深刻地认识到系统的核心信息, 更不能有效地开展运维工作。

2.3 运维机制不健全

2.3.1 建设与规划相对落后

目前, 我国电网企业的建设规划相对滞后, 有些未能及时跟进, 导致与电网

信息化建设相脱节, 运维系统各类功能相对分散, 存在重复建设现象, 不利于运维管理的一体化和数据的简洁化, 数据冗余现象较为严重。

2.3.2 缺少数据质量监控手段

运维机制不健全最主要的体现就是缺少数据质量监控手段。现有的运维监控都采取的是数据质量定期汇报制度, 这一制度能够起到对数据进行监控的维护的作用, 但其往往都是在事后展开的, 造成了事前对数据缺乏预警。同时, 这类事后监督的方法, 通常需要消耗大量的人力物力, 而且存在监控流于形式等问题, 使得监控并不能达到应有的目的。

2.3.3 需求申请机制不完善

系统维护工作通常由基层维护人员开展, 当出现与建设信息不相符的状况出现, 没有完善的需求反应和申请机制, 造成拖延, 需求长期难以得到满足。电网企业制定的管理制度与规程不统一, 也影响了需求申请机制的响应时间。

2.3.4 问题反馈机制不健全

现有的运维工作中, 对于出现的问题, 往往还是停留在单一地解决故障方

式上, 没有及时向上级单位汇报的机制, 同时系统也没有建立相应的问题数据库。这使得基层人员只能够按照规定进行工作, 不能够有效地避免问题的再次发生, 增加了运维的成本又不能获得较高的效率。

3 改善运营管理的措施

针对现有的问题, 各级别数据集中模式下的运维管理系统要在合理规范的管理制度为基础的前提下, 在运维工作中重视各个系统间的整体性和相连性, 将运维工作各个环节流程化、制度规范化, 同时结合严格、扎实的监管工作, 这样才能建立一个有效且稳定的运维管理系统。基于此, 提出以下几点措施:

3.1 加强技术培训

3.1.1 加大培训力度

目前, 电网企业运维管理的培训力度明显不足。必须要在省市级别和基层运维单位均开展具有针对性的培训工作。特别要针对数据集中模式下的特点, 对运维、管理工作进行分步骤、分别段、有针对的培训工作, 对基层运维单位工作人员的培训力度和频率更要加强。

3.1.2 完善激励体质

对于所有层次的运维管理工作, 均要一视同仁, 定期开展评比与研讨活动, 调动运维工作人员的工作积极性和学习主动性。鼓励运维管理工作人员积极探索新知识与新技术, 提出有建设性的意见, 并给出物质和精神鼓励。

3.2 完善运维体系, 理顺运维关系

3.2.1 加强制度建设, 规范管理

在将互联网和跨平台技术应用到信息系统的基础上, 不断完善电网企业的数据质量保障制度和运维工作体系, 进一步将运维的责任深入落实到各个基层和领导单位, 同时要建立各个相应的制度, 从管理着手使运维工作规范化、体系化, 在足够的技术支持和制度支持下确保运维中的网络管理、应用管理和安全管理各项工作的平稳开展。

3.2.2 科学地设置岗位

对于省市级别和基层的运维工作人员要有针对性地设置岗位, 省市级别的技术人员可以更多地开展指导性工作, 将基本的运维工作权限放开给基层技术人员。对基层运维人员的操作水平要加以鉴定和区别, 针对实际情况将技术性强的岗位交给熟悉业务和精通技术的工作人员担任。同时应该针对各层次信息互通的问题, 设置专门的岗位对基层问题汇总、分析并汇报, 整合上级单位的意见和指导开展运维管理工作。

3.3 健全运维机制, 提高运维效率

3.3.1 建立技术交流机制

现有运维机制很大一个问题在于缺乏沟通。良好的交流机制应该是能使各个级别的运维管理工作人员都可以自由地阐述自己的工作现状和工作中遇到的问题, 能大大提高运维工作经验的共享性。

3.3.2 建立运维数据库

针对上文中提高的缺乏故障问题数据库问题, 应该要建立包含以往运维工作中运行数据、故障分析等内容的运维数据库, 这能够为运维工作提供一个前后代交流的良好平台, 也有利于运维经验的积累, 更能够有效地整体性提高运维工作人员技术水平。

3.3.3 建立数据监控中心

数据监控中心能够对运维数据进行实时分析, 将省市级别中心的技术资源优势发挥到最大化, 同时建立了技术与业务互动基本渠道以更好地展开下一步运维工作。

3.3.4 提高数据的扩展性与兼容性

研究数据运维技术, 提高数据的开放型和兼容性, 使之能够普遍兼容各种主流的平台和数据库, 具有良好的可扩展性, 方便与其它系统兼容和功能扩展。

4 结语

当今世界正在经历一场以信息化为主要代表的产业革命, 在信息量越来越大, 数据越来越多的社会中, 电网企业对数据集中模式下的信息系统运维管理也有着越来越高的要求。因此这对管理中的办法、方式要求有适应时代的发展, 必须要在认清环境的基础上, 选择正确适当的措施, 促进电网企业信息系统的良好发展。

参考文献

[1]叶力旋, 焦扬, 梁廷康.企业信息系统运维模式探讨[J].企业信息化, 2012 (10) :205.

[2]徐晖.在数据集中模式下电网企业信息系统运维管理初探[J].电力信息化, 2009 (3) :19-20.

运维管理系统平台作用 第11篇

关键词 :运维 标签 网络 信息

随着社会的网络信息化覆盖面越来越广,通信机房的设备越来越综合化、多样化,越来越多的远端机房的应用,机房的规模随之增大,面对大面积、远端的通信机房、众多的设备、大量的日志,传统的标签、书面记录、视频、网管系统的应用,传统的运维管理模式已经不能满足目前通信的实际需求,必须寻求一种现代化的软件来代替原有传统的运管模式,使得复杂、多样的运维管理能够简单化,从而提高故障处理、资料管理、数据查询、设备监管等工作效率。由此我们进行一些探索和尝试。

主要功能

1、站点导航

为使得长江沿线通信机房均能使用运维管理系统,软件考虑设计了站点导航功能,通过站点导航的图片,可以轻松地导航到长江沿线的各个机房,实时查看到机房内的资料,以及业务管理情况。

2、运维规范

任何工作都有其规章制度,规范、流程对于运维管理来说更为重要,如果期间出现差错,将会带来很大的损失。规范、流程应及时更新,在功能设计时,应该提供可更新、添加功能。其次,规范应能轻松进行查阅,当运维工作人员遇到紧急业务时,可快速查阅。

3、设备管理

通信机房,最重要的莫过于设备资料的管理,随着设备越来越多,通过原先的标签和文档来注明各种资料已经完全不能满足要求,一方面,资源不能很好地共享,经常出现设备资料只有固定的少数几个人掌握;另一方面,由于设备集成高,体积小,端口多且复杂,电路的来龙去脉比较繁杂;再则综合机房、远端机房温度偏高,随着时间的推移,端口标签经常会出现脱落现象,由此也给设备判断带来困难。

鉴于此,设备资料通过信息化管理更为合适,不仅能够解决上述困难,而且给运维工作人员减轻负担。

4、值班信息

值班信息主要功能是对机房日志资料的管理,通过包括值班记录和基础数据,值班记录是对值班信息的实时电子记录,实现用电子台帐来代替传统的文本台帐。利用电子台帐来进行管理运维日志后,可实现日志的数据库管理,可以轻松进行统计和查询,可方便实现月度、季度、年度或者任意时间段信息的统计,同时也提高值班记录的痕迹管理,加强了值班、维护人员的工作责任性和自觉性。

5、故障处理

维修记录主要实现设备维修的记录历史,各个设备有各指示灯对设备其运行状况、端口属性和特性指导作用,工作人员根据设备技术说明书、对其日常维护和故障处理经验,进行相应的记录,同时系统会自动统计该设备的出现故障的处理方式以及出现次数的多少,根据记录,当日后当再次出现故障时,可根据该系统功能模块进行逐一排查、比对,对其常见故障进行优先检测,从而提高故障的处理效率,缩短故障时间,减轻工作人员的负担。

系统展望

运维管理系统实现以上功能投入使用后将会大大提高运维机房的工作效率,但我们感觉到系统的功能要不断更新,不断适应现代化机房的发展需求,结合我们近期工作的情况,还探索要解决以下三个问题:

设备编码问题。目前通信机房的设备五花八门,新产品越来越多,如何对设备进行科学合理的分类,成为运维系统的一个非常重要的问题,面对沿江全线通信机房成千上万的设备,全部用设备名称加以区别显然不可行。必须通过科学的分类和编码手段进行标准编码。

通信机房的图形化管理。为让更多用户理解和熟练应用软件,界面必须友好、简洁。运维管理系统最能让工作人员快速上手的界面应该以图片导航的方式来实现,但图片实现相对较复杂而且不利于今后升级。

企业运维管理论文 第12篇

(1) 定时对数据库的运行状态, 日志文件, 备份情况, 数据库空间使用情况, 系统资源使用情况进行检查, 发现并解决问题; (2) 每周对数据库对象的空间扩展情况, 数据增长情况进行监控, 对数据库做健康检查, 对数据库对象的状态做检查; (3) 每月对表、索引、约束、作业等数据库对象进行分析, 检查表空间碎片, 寻找数据库性能调整的机会, 进行数据库性能调整, 提出下一步空间管理计划。对数据库状态进行一次全面检查。

这样的管理对数据库明显存在以下局限性:一是虽然目前各种数据库产品本身提供了大量功能强大的性能监控和调试工具, 如0RACLE的OEM、Performance Manager、capacity Planer等来帮助数据库管理员对数据库性能进行调整、优化, 但是精通掌握这些工具并能通过这些工具来有效地分析数据库性能状态, 进而合理地配置数据库以调整其性能十分困难;二是数据库维护管理被动, 数据库管理依赖数据库管理员的责任心和能力, 数据库能否稳定运行和健壮性取决于管理员的态度;三是数据库日常性能、异常诊断不及时。

针对这种情况.本文提出了数据库监控系统, 实现数据库主动监控和维护, 系统通过对数据库进行日常性能监控、每月性能评估、数据库审计、异常诊断及时发现问题和解决问题。为数据库管理员提供了管理和维护数据库的辅助工具, 提高了数据库管理员的工作效率。为数据库每天24小时不间断运行提供了有力保障。提前预判断数据库性能臆患, 增强数据库的健壮性, 确保业务系统持续不断地运行。

l总体设计思路

数据库监控系统, 通过创建远程数据库链的方式与被监控的数据库建立连接, 通过数据库作业调度的方式.定期从被监控的数据库中采集各类监控指标信息, 并存人数据库监控服务器的数据库中。系统结构如图l所示。

2 系统特点

(1) 建立远程数据库链

数据库监控系统与多个被监控的数据库建立连接, 向被监控数据库中写入测试数据, 从被监控数据库中获取需要的监控信息, 在数据库监控系统中采用建立远程敦据库链的方式实现。对于频繁使用的远程数据库的连接, 建立远程数据库链 (database links) 指定连接所使用的连接描述器, 也可以指定远程数据库连接的用户名。当远程数据库链被一个SQL语句所指时, 它将在远程数据库中打开一个会话并在那执行SQL语句, 然后返回数据。

(2) 采用数据库作业调度实现信息采集数据库监控系统需要定期从被监控数据库中获取监控指标信息, 是个周而复始自动执行的循环过程, 在数据库监控系统中采用0racle数据库的作业调度方式宴现自动执行信息采集过程。

作业指定了要执行的动作以及执行动作的时间。要执行的动作可以是SQL语句PL/SQL代码块、PL/SQL存储过程、JAVA存储过程、外部过程或者在服务器文件系统中储存的任何可执行文件 (既可以是二进制可执行文件。也可以是外壳脚本) 。执行动作的时间指定了启动作业时的时间标记以及用于今后运行的重复时间间隔。

(3) 依据MPI (Memory Performance Index) 内存性能评估指数对数据库内存性能进行综合评估。

系统使用内存性能指数 (MPI Memory Performance Index) , 作为数据库内存的使用和分配情况的晴雨表, 对数据库的内存性能进行综合评分, 根据综合评分的高低判断数据库的运行状态。

下表列出了MPI中的各项指数。

3 实现功能

3.1 实现数据库日常监控

通过登记数据库链创建语句和测试表创建语句。在被监控数据库的SYSTEM用户中, 手工创建数据库链和测试表, 实现记录被监控数据库的基本信息。系统每隔5秒钟对被监控的数据库进行一次写入测试, 通过测试结果判断被监控的数据库是否正常运行。系统每隔10秒钟检测一下表空间的变化情况并计算表空间使用率。建立库缓存命中率 (共享池) , 存放SQL语句或PL/SQL块、包、存储过程对象及执行计划等, 避免对SQL语句的重新解析。建立数据字典缓冲区总的命中率 (共享池) 显示了对数据字典和其他对象的内存读操作的百分比, 当数据字典缓冲区总的命中率<90%时, 就要加大SHARED_POOL_SIZE的值。进行内存和磁盘排序 (PGA内存进程全局区) , 用户的排序可在内存中执行也可在磁盘上执行, 用以显示在内存中排序占总排序的百分比。通过查看SGA的分配情况 (SGA内存系统全局区) 其中:Fixed Size:oracle的不同平台和不同版本下可能不一样, 但对于确定环境是一个固定值, 里面存储了SGA各部分组件的信息, 可以看作引导建立SGA的区域。

3.2 实现数据库性能评估

首先定义数据库内存性能评分标准, 根据数据库内存性能评分标准计算数据库性能得分。如果如果评分MPI指数得分小于100分, 表明数据库内存性能很差, 需要优化数据库和调整数据库参数。

3.3 数据库审计

实现直观查看数据文件状态功能, 如果状态为AVAILABLE, 表示数据文件正常。如果状态为UNA-VAILABLE, 表示数据文件不正常, 数据文件不正常将不能对数据文件中的数据进行增加、删除、修改和查询操作, 需要查明原因。检查数据库死锁情况, 当两个事务需要一组有冲突的锁, 而不能将事务继续下去的话, 就出现死锁, 需要杀掉长期没有释放非正常的锁。检查不起作用的约束, 如果无效的数据库对象也业务系统有关, 则要查明原因, 否则影响业务系统的运行。检查无效的数据库对象, 如果无效的数据库触发器也业务系统有关, 则要查明原因, 否则影响业务系统运行。查找使用CPU多的用户会话, 当数据库性能降低时, 需要查看使用CPU多的用户会话, 具体分析哪个客户端机器的程序影响了数据库服务器CPU性能。

3.4 统计分析

数据库写入测试月统计, 按月统计写入测试总次数、写入测试正常次数和写入测试正常率。根据写入测试正常率可以分析数据库的稳定性。如图2所示。表空间增长情况月统计, 分析数据库中数据量大变化情况, 如果表空间在某个月增长很多, 需要查明原因。有可能是录入的业务数据量比较大, 也有可能是数据库异常引起, 需要区别对待。

结语

系统改变了传统的数据库管理和维护方式, 变被动维护为主动维护, 通过对数据库进行日常性能监控、每月性能评估、数据库审计、异常诊断及时发现隐患问题和解决问题, 将数据库隐患消灭在萌芽状态。系统通过运行后, 多次提前发现业务系统数据库由于表空间快速增长, 系统性能下降等问题, 确保了公司业务系统持续不断地运行。

系统降低了数据库管理员的工作强度, 提高了数据库管理员的工作效率, 通过数据库监控系统可以及时发现和解决数据库的各种小问题, 预判断数据库性能隐患, 避免数据库发生灾害性故障。通过数据库监控系统可以增强数据库的健康性, 确保业务系统持续不断地运行。提高工作效率和服务质量。

摘要:随着信息时代的来临, 数据越来越多, 而数据库技术也越来越先进, 特别是现阶段企业的信息化的建设过程当中, 数据库的使用已经成为企业信息化的必选项。随着电力企业信息化的不断深入, 企业中的Oracle数据库越来越多, 数据库服务中断对业务的影响也越来越大。本文提出了Oracle数据库监控系统, 可以代替人工定期从被监控的数据库中采集各类监控指标信息, 并存入数据库监控服务器的数据库中。在各类监控指标信息的大量历史数据基础上, 对被监控数据库运行状态进行统计分析, 从而判断被监控数据库的运行状态, 并评估被监控数据库的性能和健壮性。为数据库管理和维护提供科学依据。

关键词:电力企业,信息系统,Oracle数据库,管理

参考文献

[1]魏雄俊.数据库技术在电力系统中的应用, 2008-05-03.

上一篇:电网脆弱性下一篇:消化道肿瘤手术