信息系统运维范文

2024-06-11

信息系统运维范文(精选12篇)

信息系统运维 第1篇

1 规范管理制度先行

(1) 在系统不能正常提供服务时, 应采取应急处置办理用户业务, 等系统正常后, 在系统中修复系统故障时出现的错误数据等, 补录业务数据, 以下是其具体流程:首先接收故障报告, 启动应急预案并判定故障原因, 在确定修复时间后手工办理业务, 等系统恢复后补录业务数据, 关闭应急预案且编写处置报告。

(2) 数据修改规定。数据修改主要包括两项内容, 一是修改系统基础数据, 基础数据指的是系统运行的基本数据参数, 系统是否运行正常, 直接取决于基础数据的准确性;二是修改业务数据, 业务数据指的是在系统运行过程中, 在进行数据统计、数据挖掘、数据分析时, 业务操作记录前提是保障业务数据准确。对各部门的数据维护权限和责任本规定要求必须进行明确划分, 由责任部门负责修改数据, 业务人员对不能提供修改功能的数据从而在数据库层面上进行修改, 需向信息部门申请信息服务同时做好备查记录。如果某数据出现可开发维护功能, 需要多次修改时将修改权限分配给业务部门, 从而确保数据的准确性和时效性。

2 建立运维辅助系统, 完善运维体系建设

2.1 呼叫中心

向用户提供咨询方式, 收集问题最快捷、最直接的一个渠道即呼叫中心。当系统出现故障时, 用户通过呼叫中心可以及时解决, 以下是呼叫中心的具体操作流程:首先接收问题咨询, 然后分析处理问题, 最后进行答复反馈。其中, 能够直接答复简单的并将咨询问题记入“问题反馈平台”备查和分析。如果问题相对复杂, 则需在“问题反馈平台”上填写问题记录, 给技术人员处理提交反馈。

2.2 问题反馈平台

可以通过问题反馈平台, 提供更实用的问题给用户提交和反馈方式, 降低电话咨询的压力。问题反馈平台的主要作用: (1) 可以将问题进行分类, 便于统计、分析问题, 从而有利于进一步优化系统和服务; (2) 搜集系统BUG, 为用户解决遇到的问题; (3) 搜集改进意见, 以提供可靠的数据支持, 以便健全系统功能, 确保系统功能的有效性、准确性。

2.3 系统监控平台

信息部门内部加强系统监控管理的一个重要载体即系统监控平台。在制定监控方式, 以及系统监控流程时, 需结合系统的不同特点, 同时借助短信平台功能, 编辑短信, 以将问题信息以最快的速度发送到系统管理员手中, 确保其及时收到, 并及时处理和解决问题, 使得系统运维的效率及速度提升。

3 建立运维平台, 实现运维管理系统化、规范化

3.1 信息服务申请

由业务人员由主管部门领导审批, 提出信息服务申请再提交信息管理部门, 信息管理部门根据审批通过后交由技术部门实施, 业务需要提请相关业务部门会签。

3.2 管理需求分析

把握用户需求的一个重要手段即是需求分析。由于系统的使用范围越来越广泛, 用户的需求也越来越多, 这就需要进一步调整和优化业务流程和业务模式, 为避免需求盲目变更, 组织相关部门必须认真评审用户提出的新需求, 此外, 为避免一些不成熟的需求出现频繁变更的现象, 或发生需求膨胀的现象, 需整合把相关部门的意见。

3.3 制定并下达任务

信息部门把需求内容下达给技术部门, 转化为工作任务, 其中技术部门负责数据修改、简单程序修改、权限调整等任务, 由技术部门编写计划调研系统开发的需求, 组织相关部门负责。

3.4 开发部署管理

技术部门需对通过审批的需求, 进行再次的需求并编写需求规格说明和详细设计, 分析工作量确认和需求调研, 并组织开发人员制定开发计划, 同时根据工作需要按计划实施开发, 及时调整开发计划, 确保计划的有效性。开发完成后, 开发人员需提交发版说明以及操作指南、相关测试文档等技术文档, 并提出发版申请, 负责测试的是信息部门, 待通过测试、审核后, 发布发版通知系统升级。

4 系统的运维模式探索

4.1 建立规范化运维体系

(1) 根据工作任务, 制定相应的工作岗位, 并明确各岗位的岗位职责, 以使本岗位人员明确认识本岗位的工作任务。 (2) 根据工作内容, 明确各流程节点的工作任务以及岗位人员等, 将工作流程梳理好, 同时结合工作实际, 将各项工作流程化的工作平台。另外, 建立运维工作规范化管理根据信息技术基础设施库的体系架构, 建立运维管理平台, 其组成包括:ITIL流程管理、配置管理数据库、系统服务台、资源管理、运维管理以及日常工作等部分, 其融合了网络管理、系统管理、变更管理、系统开发管理等管理活动和问题管理、资产管理等很多流程的理论和实践经验。通过应用管理矿建、建立管理工具、梳理内容等, 使运维体系规范化, 这样运维工作便可有制可依、有据可查、有章可循, 经实践证明, 效果显著。

4.2 提供专业化运维服务

根据集团公司的专业版块, 以及运维人员不同的业务背景和实施经验, 建立了相对固定的运维小组, 以提高运维服务的专业化, 同时, 采取企业负责制, 由该小组专门对企业业务管理特点进行梳理, 并建立企业管理业务详细情况和关键用户联系清单, 以对企业业务和人员进行全面的了解, 从而提高运维服务的质量。此外, 根据功能模块负责建立功能模块负责制的原则, 即负责各相应的功能模块由一个运维人员专门, 如果发生数据、功能、操作等方面的问题时, 由该运维人员运维工作采取的企业负责及时进行跟踪与处理, 采取模块负责双向网格化的方式, 打破了传统的管理模式, 不仅将内部运维管理责任进行详细划分和实施, 也提高了运维服务的专业化, 使用户都享受到了VIP待遇。

4.3 形成主动化运维机制

数据决定着信息系统应用的成败, 针对系统运维最开始存在的问题, 在系统中相应地添加了数据逻辑校验和系统操作提示等功能, HSE信息系统的运维根据企业和模块这两个维度, 建立了主动化运维的机制, 运维人员需对系统数据的质量进行主动检查, 并根据所得的系统数据并对企业在系统应用方面, 存在的问题进行判断反馈系统应用情况。根据发现的问题, 进行企业现场培训系统功能缺陷排查, 并提供相应的主动化服务等。通过该机制, 可以找出系统存在的问题, 从而进一步完善和提升系统功能, 同时, 也可以为用户提供更专业化的服务。

5 结语

为信息部门做好运维管理工作提供了技术平台, 信息部门运维体系的建立, 需全程参与并主导运维工作的实施, 并把握好文档审核、进度控制、需求评审、数据库审批等过程环节, 重点对运维数据为系统运维服务优化、功能优化提供数据参考, 统计分析进行关注提高了系统运维效率, 服务质量提升了。

摘要:系统应用支持需求量大、用户变更频繁、涉及用户多、分布范围广等问题, 都是信息系统运维目前面临的难题, 因此, 运维管理人员的首要任务即有效利用资源, 以使运维服务更加专业、主动、规范, 以满足各业务管理系统用户的要求。

关键词:信息系统,运维体系,运维机制

参考文献

[1]孙元军.信息系统的安装与配置[J].计算机与信息技术, 2011 (9) .

信息系统运维管理办法 第2篇

第一章 总则

第一条 为加强我行计算机系统的运行维护工作,保障系统安全稳定运行,进一步提高系统的维护质量和效率,制定本管理办法。

第二条 本办法所称信息系统,是指我行日常经营和业务办理所使用的计算机软件、硬件及基础IT设施,包括各类业务软件系统、机房设施、网络设施、服务器设施、电脑终端设备等。

第三条 本办法中出现的词条解释如下:

(一)运行维护手册:针对运行维护人员编写的有关系统日常维护、监控、备份、一般性故障处理、软件安装、操作、配置方法及其他相关信息的文档。

(二)运行维护:由运行维护人员按照运行维护手册的要求,进行日常的运行监控、备份、安全管理、一般故障处理,受理用户维护申请,解答用户疑问的工作。

第四条 信息系统运行维护工作的基本任务是:做好系统或设备上线投产、升级、日常监控、备份、安全管理,预防、处理各类系统故障,提高我行计算机系统的整体运行水平,保障我行业务连续性计划的顺利进行。

第二章 岗位职责

第五条 运营管理部系统运维岗位人员负责我行信息系统的运行维护工作。系统运维岗按运行维护手册的要求进行一级维护,如无法按时解决问题,需第一时间请求主发起行协助,并在主发起行运行维护人员进行技术指导下完成相关维护工作。

第六条 系统运维岗应积极接受相关设备厂商或项目组组织的运行维护培训。培训内容应包括系统的体系架构、软硬件安装、配置、日常维护方法、备份和恢复策略、一般性故障的处理方法等。

第七条 运营管理部运行维护人员的主要职责包括:

(一)做好系统上线投产的环境准备工作,包括网络、不间断电源等。各项技术指标应满足系统软硬件的要求。

(二)在项目组的协助下,完成硬件和操作系统的安装和配置工作。

(三)利用培训和系统上线机会,掌握系统维护技术。

(四)制定系统日志、负载监控、系统备份和恢复策略。

第三章 日常管理

第八条 系统运维人员应按既定的策略和《运行维护手册》的要求,承担系统的日常运行维护工作。包括运行环境监控、软硬件运行状况监控、系统备份管理、安全管理、一般性故障处理、用户申请受理等。

第九条 系统运维人员应做好硬件及网络的定期检测,发现问题及时处理或第一时间报告项目组和运行中心负责人。

第十条 系统运维人员需详细记录日常运行维护情况,并定期向项目组提供运行情况汇总和统计数据。

第十一条 系统运维人员需根据系统运行情况,及时提出软硬件升级或修改建议。

第十二条 系统运维人员应加强安全管理和安全制度建设,定期进行安全检查,严格权限设置和密码管理。对重要的系统,可不定期的进行安全审计,借助外部力量提高我行业务连续性水平。

第十三条 运行中心维护人员应对易受病毒攻击的系统安装防病毒软件,并根据生产安全的要求,定期进行病毒库升级和病毒检查。

第十四条 明确各系统的职责分工,对重要的系统应实行双备份。

第十五条 运行维护人员调离时,必须移交全部技术手册及有关资料,并更换计算机的有关口令和密钥。

第四章 故障处理

第十六条 信息系统故障处置应遵循“快速定位、快速处置”原则,确保第一时间恢复业务经营活动。用户在系统使用或监控人员在运行监控中发现异常现象,首先向运营管理部报告,运行维护人员应立即报告运营管理部负责人,并按《运行维护手册》及相关规程进行维护。

第十七条 如出现非常规故障或运行维护人员在规定时间内按《运行维护手册》无法解决问题时,应立即通知相关厂商或报告主发起行要求协助解决。

第十八条 网点信息系统常见重大故障处置流程如下:

(一)网络系统故障:网点生产或办公终端出现一定范围网络中断,不能正常连接总行业务系统时,网点计算机协管员应立即报告总行运营管理部,由总行运营管理部对故障原因进行定位并远程排查(以运营商线路故障为主),必要时,运营管理部将以电话指导方式由计算机协管员在现场协助操作。出现重要网络设备故障时,运营管理部应第一时间赶赴现场进行排查和更换;

(二)计算机病毒疫情:网点发现生产或办公终端感染计算机病毒,计算机协管员应立即停止使用疫情计算机,切断网络,隔离一切涉嫌感染病毒的信息介质和设备,并报告总行运营管理部。总行运营管理部应及时查明疫情计算机病毒来源并及时清除病毒;

(三)UPS系统故障:网点UPS系统出现蜂鸣或指示灯告警时,计算机协管员应准确记录蜂鸣频率或指示灯状态,立即报告总行运营管理部,由总行运营管理部根据故障现象对故障原因进行定位,同时,总行运营管理部应安排专业工程师赶赴现场对故障UPS设备进行检修和恢复。

第十九条 系统故障排除后,运行维护人员应填写系统故障处理单,详细记录故障现象、解决方法、处理结果等。故障处理单应归档保管并定期汇总。

第二十条 根据故障的紧急程度,故障申报可采用电话、电子邮件、传真等方式。

第五章 备份管理

第二十一条 鉴于信息系统体系结构的多样性,应根据各系统对数据安全性和业务连续性的不同要求以及其他实际情况,制定系统备份和恢复策略。

第二十二条 运行维护人员必须按备份策略要求,做好系统及数据的日常备份工作。

第二十三条 根据“**信息系统数据管理办法”中有关“数据备份”的要求,妥善做好备份介质的保存、使用、借用和销毁工作。

第二十四条 运行维护人员应保证备份及恢复策略的正确性和可操作性。对连续性要求较高的系统应定期或不定期的进行系统恢复或切换演练。某些系统可考虑采用双机热备份。

第六章 附 则

信息系统运维 第3篇

关键词:电力用户;用电信息采集系统;运维要点;电力系统;用电管理

中图分类号:TM76 文献标识码:A 文章编号:1009-2374(2014)36-0122-02

1 概述

电力行业的发展是伴随着经济水平的发展而逐步提高的,电力行业的科学发展需要建立在对用电信息的收集处理上。用电信息采集系统的建设能够为实现国家电网系统全面采集、全面覆盖和全部费用监控提供技术支持,并且为生产管理中的现代化数据化信息管理提供技术保障。用电信息采集的构成是由采集主站、采集终端、智能电能表以及双向通信体系共同来实现的。

作为电网核心的用电信息采集以及用电检测管理是对用户用电数据的收集和分析来实现的。通过运用智能的数据管理系统能够实现用电计量、费用结算、绿色用电,有效地控制窃电等违法的事情发生,实现对用电信息的自动化管理,保证了电力企业服务的准确性,降低了运行服务中的成本管理。

2 用电信息采集系统的特点

用电信息采集系统可以实现自动地对用电数据的统计,实现自动抄表的功能特点,减少了人工抄表带来的不便利性。采集系统能够对数据进行自动的分析统计,避免了大量人力工作的付出,为科学化运行提供了

基础。

用电信息采集系统还可以对运行中的线路的健康状况进行监控,能够通过对电量的自动统计以及线损的分析实现对电网运行情况的全面监测,及时对不正常用电的情况进行分析。对不正常用电信息的反馈分析能够准确地预防窃电行为的发生,减少电力损失。

电力采集系统能够实现用电费用的控制功能,并能对阶梯电价进行控制。用电系统中的智能电能表能够有效地控制在电力缴费上面临的困难,对电力用户起到约束作用,并能够在阶梯电价中对用电合理计费。通过对用电信息采集系统的管理能够实现对用户的管理,达到科学管理的目的。

3 用电信息采集系统运维中的常发性问题

在对电力用户用电信息采集过程中由于建设的不统一导致现存的不同的用电信息采集系统的存在。对各系统的维护管理的部门、人员也不是固定统一的,后期建设中面临许多的困难。在后期的管理建设中通过对经验技术的总结交流为技术服务提供了大量的事实依据,在提升管理水平上创造了条件。但是在技术应用中仍然存在一些问题:

第一,对不同的用电信息采集系统来说,采用的技术标准是不同的,虽然在一定范围内能实现数据的互换性,但是却不能实现数据的互通,在应用中不能发挥出应有的作用。在相同的地区对用电信息采集系统的认购有不同的方案,这也导致了所采用的系统的不兼容性的发生。

第二,在设备的安装方面同样由于施工中的档案建立不准确、信息内容不完整等内容造成了在后期运营中的不准确性。例如在进行信息统计过程中高低压线路的管理信息不完善,旁支线路的管理不规范等系列问题都能造成在运行中出现复杂的问题。

第三,用电信息采集系统在建设完成后实际的运用过程中,为确保运行系统的稳定需要进行相应的维护管理。经实际调查发现在系统的实际运用中,各不同的单位在应用中存在一定的差距,对系统的充分开发应用中使用率相对比较低。在维护过程中需要注意电能表的轮换和保养工作,正常的电能表的更换周期为8~10年,实际应用过程中电能表的更换周期较长,不能满足电能的正常计费运行。对建设的用电信息采集系统使用维护的数据准确性不能得到有效的保障,实际应用中对维护保养的不及时导致在实际使用中出现设备、线路的损坏现象不能及时发现,甚至在出现窃电的情况时不能及时得到反馈。

第四,用电信息系统的建设是由多部门、多单位共同联合建设完成的,在各单位中工程承包商、集成商、表计商和业主单位对工作不能做到合理分配,没有完善的施工控制计划,导致在施工建设过程中出现不可预料的情况。

4 用电信息采集系统运维中常发问题的解决

第一,对用电信息采集系统进行建设时需做好各方面的工作,对设计方案要做到合理、明确。在设计中需要联系实际现场工作情况,对所安装的地点以及周边环境分布情况进行详细的调查了解,通过对现场的考察做到设计满足实际需要。针对现场的情况对建设所需设备的数量、型号等做到统计规划。在对现场的设计方案应用中还应对建设方的实际建设能力做到详细考察,避免因建设方的实力不足造成的建设任务的延迟以及建设不能顺利进行的现象出现。

第二,在用电信息采集系统建设完成之后还需要对工程做好验收工作,建设单位还应根据相应的检验检查标准对所建设完成的工作做好验收。建设单位自检合格后才能进行相应的工程的验收,对验收的结果要做到真实有效。

第三,对运行维护过程中出现的电能表轮换问题需要制定出更合理的对策。为保证电能计量装置的稳定运行需要加强对电能表的管理维护,及时淘汰工作不稳定的设备。在系统建设完成之后,管理单位会安排相应的工作人员对现场进行相应的信息等级运行维护等工作,对所安排的工作容易出现工作人员的工作量不平衡,使现有的劳动力不能充分发挥作用,再加上各自只负责自己的工作没有相应的沟通交流,工作质量不能得到保障。为了更好地实行管理需要在提高工作人员技能的前提下进行统一的管理,提高工作人员的职业素质。

第四,遵循相应的规章制度,对所建设的用电信息采集系统进行相应的检查登记。在相关工作人员的配合下对所安装的电能计量装置逐一进行排查核对,对所安装的设备进行登记管理,对所安装的设备参数进行相应的测量记录,统一进行登记输入采集系统中。对施工建设过程中的安全管理做到严格检查,制定相应的安全建设规章,保证建设质量的稳定。对作业中的过程要有相应的技术标准,并严格按照施工要求进行标准化作业。对所建设的任务要做好相应的运维管理工作,对所建设的任务要做到稳定扎实可靠。对施工单位建立的施工档案还需要专人进行收集管理,对工程档案不健全的工程拒绝验收,从而保证工程质量的稳定以及工程档案的完整性。对建设中出现的问题要及时反馈解决,对存在的问题要处理完全。对施工中的工程工艺标准需要安排相应工作人员去现场进行检查,对发现的问题要及时制止并限期整改,保证施工质量的完整性。在解决工程质量以及工程进度的问题上可以实行图表法进行现场安装勘察,对现场所安装设备的参数进行相应的记录,同时确定施工图纸与安装设备清单是否吻合一致。对所建设的工程要在按时完成的前提下保证工程质量,做到工程建设质量与建设进度保持在一致的情况下。

5 结语

电力用户用电信息采集系统的应用满足了现代化市场发展的需要,在降低人力成本的情况下实现了对用电信息的采集应用,在实现对用电信息远程监控的前提下还满足了人们的不同需要。对用户用电信息的采集满足了供电企业对供电利润的追求,同时也需要进行合理的维护管理,在保证正常运行的情况下满足可持续发展的要求。对施工前的运维管理是保证后期系统稳定运行的前提,对建设完成后的运维管理是保证系统可靠稳定运行的必要工作。

参考文献

[1] 刁培忠.用电信息采集系统在电力企业的应用分析

[J].中国电力教育,2010,(9).

[2] 陈琦,李小兵,曹敏,等.电力用户用电信息采集系统建设的研究与探讨[J].陕西电力,2011,39(6).

信息系统运维 第4篇

信息系统的运维是其正常运行的保障。信息系统运维的内容很广泛,包括对系统的实时监控、日常检查、变更和升级、故障和异常处置等方面。运行维护的对象一般包含计算机、网络、存储及安全设备等硬件,数量较多。为保障系统业务处理的连续性,很多系统采用了主备模式或者并行模式,使得设备数量倍增。

由于运维设备的数量较多,加上运维及时性、准确性的工作要求,使以现场检查处置为主的“现场式”运维模式面临着巨大的挑战;而运维部门普遍存在的技术人员数量有限和机房与办公场所隔离等现状,更是放大了“现场式”运维模式的不足。

二、“现场式”运维模式的不足

一是不便于机房的安全管理。根据信息系统安全等级保护的基本要求,外来人员只有办理申请和审批手续后方能进入机房,且其活动范围应受到限制和监控。虽然在实践中已根据设备功能分区摆放设备,但物理隔离机房各个分区并不现实,限制外来人员活动存在一定的难度。

二是不利于及时发现和处置系统异常。由于技术人员办公场所与机房隔离,第一时间定位、处置系统异常有一定困难。

三是不利于提高设备检查效率。异常处置时,技术人员常常需要逐一、串行地接入故障链条上的多台设备进行排查,操作效率低,耽误故障处置时间。

四是不利于审计管理。在机房设备中,除了服务器设备外,网络、安全、存储等设备的安全审计功能并不完整,无法满足快速、准确、实时地记录操作人员、时间和操作命令等细节的要求,不利于保障信息安全和防范非法操作。

五是不利于技术人员的人身安全。“现场式”运维需要技术人员进入机房操作,维护工作时间比较长,长时间在辐射、噪音、低温和密闭空气环境中,不利于技术人员的身心健康,且机房内安装了气体消防设施,一旦发生意外,将对机房内人员的人身安全构成极大威胁。

三、以集中管控系统为核心的运维模式

针对“现场式”运维模式的种种不足,将基于模拟信号数字化、集中认证系统和远程网络等技术的集中管控系统应用于信息系统的维护工作上,可以大大提高运维效率。

(一)集中管控系统架构

集中管控系统以TCP网络为基础,将鼠标、键盘和VGA视频的模拟信号及Console信号通过专用设备转为网络数字化信号,以集中认证系统服务器为中心,通过统一客户端界面登录、操作、控制机房内的服务器和串口设备的功能,实现对机房设备远程集中管理。在提供远程管理功能的同时,系统还保留了本地管控功能,两种方式互相备份,实现管控功能的高可用性。

在系统安全性方面,通过对接入设备的IP进行定义和许可,屏蔽部分非法IP地址列表的访问,提供安全的远程连接和数据保护;在系统上设置访问列表,限制非法用户连接,保障客户端连接的安全性。

(二)集中管控系统的设备接入

集中管控系统管理的设备分为KVM设备和串口设备,分别用不同的数据连接线将设备接入,如图1所示。

1.将小型机及Windows设备的键盘、鼠标和VGA视频接口连接到服务器智能连接模块,通过CAT5专用线连接到KVM管理设备。而交换机、路由器等设备从串口接入串口管理设备。

2.安装集中管控系统服务器。用一台安装集中管控管理软件且性能较好的PC作为集中管控系统服务器,将服务器、KVM管理设备和串口管理设备的IP地址设置为同一网段,接入二层交换机;在软件界面将KVM管理设备和串口管理设备加入被管理设备进行集中认证管理,本地管理使用三合一控制台进行操作,远程管理通过IE浏览器进行,完成软硬件的安装和配置。

(三)分组、分级使用集中管控系统

由于系统设备数量多,所涉及的技术知识和操作方法都不尽相同,例如按操作系统类型可分为Windows,AIX和Linux系统,对于技术人员来说,其专业各有所长,管理各有侧重,因此,无论是主观或是客观上都要求分组管理设备,实现同组设备操作方式、方法的统一,提高系统操作准确度。而为了确保操作安全,则需要根据设备的重要程度和操作人员操作权限不同,对设备的操作权限进行分级设置和管理。

1.分组管理设备。系统设备按照类型可分为服务器设备、网络设备、安全设备、存储设备和客户端设备,按照重要程度可分为核心设备、边界设备、离线备份设备和测试设备。以一个由核心应用服务器、主备Web服务器、离线测试小型机、存储设备、交换机、路由器、防火墙、密押服务器、网络加密机、入侵检测系统以及相关设备管理客户端组成的多层信息系统为例,分为8个组:核心服务器设备、核心网络安全设备、核心存储设备、边界服务器设备、边界网络设备、离线服务器设备、测试设备及客户端设备;如核心服务器设备是核心设备和服务器设备的交集,核心网络安全设备是核心设备和网络设备、安全设备的交集,依此类推,见表1所列。

其中红框内的设备是重要程度和操作要求较高的设备,需要有较高权限的技术人员才能操作,红框外的设备可以由操作权限低的技术人员进行简单的不涉及变更的系统操作和检查。完成分组后,在集中管控平台中按分组类型设置设备组,将设备分别添加到各自的设备组中,实现按组管理。

2.分级设置用户权限。系统用户按权限分为4级,第一级是超级用户,可以登录所有的系统设备并进行任意变更操作;第二级是受限用户,可对权限范围内的设备分组并进行变更;第三级是监控用户,只能通过特定的操作界面在权限范围内对系统的状态、参数进行检查,而无权进行变更;第四级是测试用户,可以登录到测试系统设备进行系统培训和操作练习。

由于超级用户权限大,操作风险度高,因此用户数量应严格控制;受限用户则根据人力条件,合理分配设备分组,保证所有受限用户的管理范围覆盖所有的设备,同时受限用户所管理的设备应根据技术人员的技术水平、方向进行分组,保证技术人员的技术、优势得以充分发挥。监控用户日常操作内容为:从设备列表界面查看设备是否在线、判断设备是否可用,登录网络和安全设备、检查网络和安全设备状态,完全覆盖了机房所有设备日常检查内容。

四、运用体验和设想

通过远程集中管控系统整合分组管理设备,实现本地或远程对设备的深层次的控制和管理,技术人员对设备的维护管理更加便捷;通过分级管理,也使对设备的检查和操作更安全可控。在利用集中管控系统实现远程管理的同时,仍保留了本地KVM管理模式,消除因集中管控系统异常而失去对设备的控制的风险隐患。在以集中管控系统为核心的运维模式下,运行维护工作覆盖了机房的所有设备,响应系统异常的时间进一步压缩,充分弥补了“现场式”运维模式的不足,大大提高系统安全性,有效提升了系统维护水平。

参考文献

[1]刘方畅.浅析信息系统运行维护体系[J].信息系统工程,2015(12):97-99.

信息系统运维 第5篇

项目名称:新审判大楼智能化系统(弱电)项目 填报人姓名:成杰 联系电话:020-83211051 填报日期:2017年9月30日

一、项目基本情况及自评结论

(一)项目用款单位情况 1.主要职责

广州市中级人民法院是国家审判机关,依法独立行使审判权,监督和指导下级法院的审判工作,接受广东省高级人民法院的监督和指导,对广州市人民代表大会及其常务委员会负责并报告工作。主要职责是:

(1)审判法律规定、广东省高级人民法院指定由本院管辖和本院认为依法应当由本院审判的刑事、民事等第一审案件。

(2)审判法律规定的对基层人民法院判决和裁定的上诉案件、抗诉案件。

(3)审查处理不服本院和下级法院判决、裁定的各类申诉和申请再审案件,审判依审判监督程序提出再审的案件。

(4)审判由广东省人民检察院、广州市检察院按照审判监督程序提出的抗诉案件。

(5)审查申请承认外国法院判决、裁定及申请撤销、承认国际仲裁机构裁决的案件。

(6)对下级法院管辖不明的案件等指定管辖。(7)监督和指导全市基层人民法院的审判工作;管理、协调全市法院执行工作。(8)依法行使司法执行权和司法决定权;依法决定国家赔偿。

(9)对有关法律、法规、规章草案提出意见;对案件审理中发现的问题提出司法建议。

(10)负责全市法院思想政治、教育培训工作;按照干部管理权限管理法官和其他人员;协助管理全市法院的机构编制;负责全市法院的纪检、监察工作。

(11)管理本院物资装备,指导和监督基层法院物资装备的管理工作。

(12)结合审判工作宣传法制,教育公民自觉遵守宪法和法律。

(13)承办其他应由本院负责的工作。2.机构人员情况

广州市中级人民法院设行政单位1个;事业单位1个,其中:公益一类财政核拨事业单位1个。

2016年末,我院编制人数619人,其中行政编制555人、事业编制64人。我院年末实有858人,其中在职人员592人(其中行政编制535人,事业编制57人)、离休人员13人、退休人员253人。

(二)项目主要内容及实施 1.项目内容 本项目是广州市中级人民法院新审判业务大楼项目的配套项目。项目主要内容包括:1)数据中心机房工程(约882平方米);2)信息网络系统(分为内网、外网、视频专网以及无线网络。其中内网、外网核心交换机,数据中心TOR交换机、视频专网、智能化专网由智能化工程负责实施,不包含在本项目范围);3)数据中心(包含三部分内容:服务器及存储;软件——数据库、软件、软件开发;信息安全——路由器、防火墙;信息化系统整体迁移);4)呼叫中心;5)数字法庭系统(数字法庭线管由智能化工程负责预埋); 6)排队叫号系统(按照审判、立案大厅服务窗口配置。排队叫号系统线管由智能化工程负责预埋);7)手机信号屏蔽系统(系统管线由智能化专业负责预埋);8)行风监察系统(按照信访室、对外立案服务收费窗口配置。系统管线由智能化工程负责预埋);9)多媒体交互控制系统;10)800M数字集群共网;11)指挥中心应急指挥平台。

项目建设周期为2016-2018年。2.项目实施

项目立项申报、招标采购、项目验收都严格按照《关于印发2016年广州市本级财政投资信息化项目申报指南的通知》、《广州市科技和信息化局关于开展2016年市财政投资信息化项目建设方案设计工作的函》、省财政划拨建设电子法院专项经费安排组织实施。各个子项目正在实施中。

(三)项目自评等级及分析

本次项目自评分数为86分,等级为良好。1.绩效目标

为满足市法院审判业务发展的需要,需不断加大科技建设的步伐,积极组织实施信息化建设项目,采用各种先进技术,提高审判管理水平和审判执行工作效率、塑造司法公正形象、提升司法公开水平,使市法院信息化建设在全省乃至全国继续保持领先水平。(1)通过本项目实施,建设功能齐全、技术先进的信息化广州市中级人民法院新审判业务大楼,满足广州市中级人民法院新审判业务管理及其配套的需要;(2)通过本项目的建设,确保信息系统能与新审判业务大楼同步建设完毕、同步投入运行,有利于广州市中级人民法院充分发挥其职能,提高办案的质量,方便群众办事,缓解社会矛盾,维护社会公平、正义,构建和谐社会,产生良好的社会效益。

2.资金安排及到位情况

2016年省人大批复市法院新审判大楼智能化系统(弱电)项目专项资金1277万元,已全部到位,资金到位率100%。

3.资金使用情况

2016年项目实际使用资金406.93万元,资金结余870.07万元,资金当年使用率31.87%。余下资金正按计划 使用。

4.资金管理情况

项目资金使用严格按照《广州市中级人民法院财务管理制度》、《广州市中级人民法院采购管理规定》、《广州市中级人民法院固定资产管理办法》等资金管理制度执行。我院严格按照项目管理规定和相关财务管理制度的要求,组织开展项目资金的申报、拨付、使用、管理等工作。专项资金做到专款专用,积极开展事前、事中和事后的监督审核把关。项目资金使用严格按照审批程序执行,重大支出由院长办公会讨论决定。项目支出基本通过广州市财政局国库支付系统办理直接支付,行装处财务科备有可追溯的全套完整资料,项目资金核算完整、准确、规范。

5.项目管理情况

(1)成立领导参与的项目管理领导小组,指导项目建设及管理工作;

(2)成立由信息化主管部门主导的项目实施监督小组,监督项目的建设质量及进度等;

(3)成立由领导小组核对指导中心、实施方、监理方共同参与的项目协调小组,完成建设各阶段事务的协调工作;(4)由承建方成立相对固定的实施小组,并指定拥有丰富研发经验的人中出任项目负责人,依照项目计划实施项目。

二、绩效表现

(一)资金使用绩效

2016年本项目预算批复市本级财政资金1277万元,资金于当年全部到位。项目当年实际使用资金406.93万元,资金的支付均依照项目建设方案进行列支。本项目资金严格按照相关规定进行管理,财务核算规范,资金按规定用途和标准使用,无虚列、截留、挤占、挪用、超标等违规情况。项目正按计划推进,进度符合要求。项目实施完成后,会极大地提高我院审判管理水平和审判执行工作效率,提升我院司法公开水平,使市法院信息化建设在全省乃至全国继续保持领先水平。

(二)存在问题 无

三、改进情况 无

广州市中级人民法院

电网企业信息运维模式探讨 第6篇

[关键词]电网企业;信息运维;模式

经过多年信息化建设,很多电网企业已在市场、生产、财务、人力资源等领域建立了业务处理系统,实现主营业务、日常办公信息化。企业运作越来越依赖于网络与信息系统的安全、稳定运行。信息部门运维工作压力陡增,运维人员加班加点已经成了工作常态,而管理层、用户仍常常抱怨问题得不到及时处理。如何走出当前信息运维困境,建立高效的信息运维管理模式,保障企业网络与信息系统安全、稳定运行,是电网企业亟待解决的问题。

一、电网企业信息运维工作现状

1、被动“救火”式运维,网络与信息系统运行质量难保障。

电网企业信息化都经历从无到有、从小到大的过程,很多企业在信息化建设初期仅有数台服务器、网络设备,设备故障、停运对企业日常运作影响甚微。信息运维采用运作简单的事后“救火”模式,运维人员象消防队员一样,哪里出现故障了就去哪里处理。这种模式和较小的系统规模相适应,满足当时企业对网络与信息系统运行质量要求。随着信息化建设深化,企业网络与信息系统规模变得庞大,结构也日益复杂。例如某市级电网企业,经过10多年信息化建设,数据网络覆盖了的44个远程办公、生产场所,运行的应用系统达30个,服务器94台,网络设备、安全设备150台,桌面终端达到了700多台。随着网络与信息系统规模扩大,缺陷、故障频度不断增加。企业业务高度依赖网络与信息系统支撑,系统、设备故障将对业务运作造成严重影响,企业允许的缺陷、故障处理时限越来越短。“救火”式运维模式弊端逐渐显露。信息运维人员整天在故障中奔波,忙于事后“救火”,网络与信息系统运行质量难保障。

2、监控手段落后,运行监控力不从心。

随着信息化深化,电网企业信息化设备数量迅速增长,网络、终端设备广泛分布于营业区内办公、生产场所。例如某电网企业运行约300台的服务器和基础设施设备、700多台办公PC,设备分布在40多个生产、办公场所。企业配备8名信息专业技术人员,依靠人工监控设备运行状况已经力不从心,值班巡视走马观花,定期巡检不到位,对于分布在数十个远程生产、办公场所的设备更是无法定期巡视。依靠人工管理数百台PC,有了问题才事后“救火”,遇到大面积病毒感染处理、安全漏洞修补和软件部署等工作,很难按时完成。

3、手工作坊式管理,运维质量在低水平上徘徊。

很多电网企业信息运维仍采用手工作坊管理模式,运维人员按系统分片“包干”运维工作。没有统一的服务级别定义、质量标准、工作标准和工作表单,运维人员需凭自身经验开展工作,运维质量取决于个人的技术水平、经验。只有个别技术水平高、实践经验丰富的老员工能较好开展运维工作,大多数运维人员由于技术能力一般或缺乏足够的经验积累,运维工作质量、效率比较低。没有流程化的故障处理机制,缺乏对运维工作的统一调度和监控,出现了诸多不合理现象,例如:重要故障压在某个人手里面得不到处理,同时很多人力却消耗在次要工作上;技术能力强的人员做没有技术难度的日常维护工作,同时技术能力低的人员却在处理高难度的技术故障,迟迟不能解决问题。手工作坊式管理,也导致运维数据缺乏,不能对系统运行及运维工作进行分析,给持续运维改进造成困难。

二、电网企业信息运维模式探讨

1、注重风险管控,运维工作重心从事后“救火”向到事前“预防”转移。

运维工作重心从事后“救火”向事前“预防”转移,加强运行监视,日常开展风险分析和风险管控,将风险由“可控”变成“在控”,预防故障发生,保障网络与信息系统安全稳定运行:

(1)明确值班、定期巡检项目和工作质量要求,形成工作标准,规范值班巡检、定期巡检,并定期检查、考核,强化运行监视和预防性维护工作。

(2)将风险管控常态化,日常开展基于问题的风险评估,编制控制措施,及早控制风险;设立专人跟踪问题处理情况,确保风险控制措施落到实处。

(3)定期开展作业风、设备基准风险评估,有的放矢开展信息安全加固,持续提高信息安全防护水平。

(4)完善应急预案,开展应急培训、应急演练,做好日常应急管理,确保在发生紧急情况时能有效控制事态发展,减少损失。

2、提高监控自动化程度,提高工作效率。

利用自动化监控系统7*24小时监控设备运行工况,例如,建设IT设备监控系统,对网络设备、服务器和存储设备集中监控,建设机房环境监控系统,对机房环境设施集中监控,建设桌面管理系统对桌面办公电脑集中监控,借助监控系统的汇总、统计和事件报警功能迅速发现设备异常、故障,提高运维监控效率。也可利用桌面管理系统快速大面积部署安全策略、软件,开展远程维护,提高桌面办公电脑维护效率。

3、运维业务流程化、标准化,让一般员工干出不一般的成绩。

大多数人都不能成为“精英”。随着网络与信息系统规模的扩大,过去那种仅靠凤毛麟角的“精英”完成运维工作已经行不通。如何组织能力一般的运维人员高效、高质量开展运维,是企业信息部门要解决的问题。这可借鉴制造业的流水线,将只有“精英”才能包揽做好的运维业务分解成包含多个步骤的业务流程,每一位员工只负责其中特定步骤,降低运维人员能力要求,“精英”则专注于高难度业务步骤,更合理运用人力资源,提高运维工作效率。建立运维工作标准,在工作标准上沉淀员工个人经验,用工作标准规范、指导各业务步骤操作,让没有经验、技术水平一般的运维人员也能高质量工作。通过运维工作标准化规范运维记录,积累运维数据,定期进行分析,发现问题,研究解决办法,持续改善运维工作,不断提高运维水平。

三、结束语

经过多年信息化建设,电网企业业务与信息化更加紧密融合,信息化设施已经成为企业业务不可或缺组件。企业网络与信息系统规模、复杂度、重要性远非信息化建设初期可比。信息运维工作难度增加和系统允许异常、中断时间减小之间的矛盾,让电网企业信息运维工作面临困境。通过运维模式创新,提高信息运维工作效率,可以帮助电网企业超越上述矛盾限制,保障网络与信息系统安全、稳定运行,支撑企业业务正常运作。

参考文献

[1]中国南方电网有限责任公司.安全生产风险管理体系.中国标准出版社,2012.

[2]GB/T 20984—2007 信息安全技术 信息安全风险评估规范

[3]左天祖,刘伟.中国IT服务管理指南.北京大学出版社,2008.

用电信息采集系统运维现状分析 第7篇

用电信息采集系统通过采集终端对各信息采集点的用电信息进行采集, 可以实现电能表数据的采集、数据管理、数据双向传输以及转发或执行控制命令。按照应用场所, 采集终端可以分为专变采集终端、集中抄表终端 (包括集中器、采集器) 、分布式能源监控终端等类型。

1用电信息采集系统物理结构

从物理构成上, 用电信息采集系统可为主站、通信信道、采集设备三部分, 其物理网络拓扑构成如图1所示。主站物理结构主要由营销系统服务器、前置采集服务器以及相关的网络设备组成;营销系统服务器包括数据库服务器、磁盘阵列和应用服务器) , 前置采集服务器包括前置服务器、工作站、GPS时钟和防火墙设备。通信信道是指用电信息采集系统主站与采集终端之间的远程通信信道, 主流技术包括光纤信道、GPRS/CDMA无线公网信道、230MHz无线电力专用信道、电力中压载波信道等。采集设备是指安装在现场的采集终端和电能计量装置, 主要包括专变终端、集中器、采集器以及各型电能表计等。

2工程概况

某省级供电企业是该省境内最主要的电网规划、建设、运营和电力供应企业。供电面积44.58万平方公里, 占该省国土面积的91.9%, 供电人口7704.06万人, 占全省人口的95.8%。该省人口密集, 居民户用电容量差异较大, 配电变压器下的居民用户数和供电半径差异较大, 营销业务系统建设采用大集中方式。

经过多年的建设, 该省级供电企业已基本完成用电信息采集系统标准化体系改造, 系统覆盖全公司直属的所有供电公司。直供直管区域智能电能表覆盖率超过50%, 农村关口采集终端台区覆盖率达到90%, 直供直管区域采集系统覆盖率达到60%, 专变用户自动抄表出账率超过60%。

3采集主站运维现状分析

目前该省所有地市公司均按照上级统一要求采用集中式部署模式将终端数据统一采集至省公司用电信息采集系统主站。投资成本较低, 便于统一运行维护;但集中式部署的系统一旦发生故障, 影响范围涉及面较广, 数据处理工作量大, 任务繁重, 不易在短时间恢复, 对系统运维技术人员的业务处理能力要求较高。个别地市公司为解决专变用户的预付费问题将终端数据同时分别上传至省级系统主站与地市公司自备的用电信息采集系统主站。

在应用层面, 用电信息采集系统主站要满足电费结算和电量分析、线损统计分析和异常处理、电能计量装置监测、防窃电分析及供电质量管理等业务需求。目前, 国网和南网两大供电企业缺乏掌握采集系统主站核心运维专业技术的人才, 自身不具备独立的主站运维能力, 对于主站的运维完全依靠第三方技术支持。这种现状不利于供电企业电力营销专业业务的推广与运维, 不利于实现用电信息采集系统“全覆盖、全采集、全费控”的建设运行目标。

4采集信道运维现状分析

用电信息采集系统的通信包含主站与终端之间的远程通信通道以及终端与智能电表之间实现数据采集的本地通信, 经过几年的发展, 供电企业用电采集系统的远程通信和本地通信都已经形成了适应自身应用的通信模式。

4.1远程通信应用现状

通信技术是实现用电信息采集系统的基础。目前, 应用于用电信息采集系统的通信技术主要有电力线载波通信、无线公网通信GPRS/CDMA、无线专网230MHz通信和光纤通信, 各种通信方式各具特点。电力线载波通信施工方便, 无需重新布线, 但其通信的可靠性、实时性、稳定性较差;无线公网需要租用移动通信网络, 运行维护及时性有待加强, 局部地区信号弱、数据采集困难, 在紧急情况下容易造成信道拥堵;无线专网230MHz通信的接入容量有限, 基站覆盖范围仅在30km左右, 受地形地貌影响大, 数据传输过程中易受高层建筑物阻挡;光纤通信一次性投资大, 成本较高, 布线困难, 工程量大。

介于上述各远程通信方式的特点, 供电企业主要采用移动GPRS/CDMA通信, 然而相对于其他通信方式, GPRS/CDM网络存在成本高和信息安全性差, 时延较高等缺点, 无法满足智能电网对接入带宽的要求。从供电企业用电信息采集系统的发展需求来看, 远程通信建设可靠性更高, 速度更快, 更安全的光纤通信专网是可行的发展方向。

4.2本地通信应用现状

本地通信方式主要有低压窄带载波通信、低压宽带载波通信、短距离无线通信和RS-485通信, 其中前三种通信方式都属于无线通信, RS-485通信是有线通信, 它们的特点分别概括如下: (1) 载波通信的可靠性较高, 维护工作量小, 传输速率适中, 但是受负载特性影响较大, 且信号衰减较快, 可靠性较差, 长距离传输需要加装中继器。 (2) 短距离无线通信也叫微功率无线通信, 传输速率低, 容易受电磁干扰, 受地形和天气影响较大, 可靠性差。 (3) RS-485通信是有线通信, 需要敷设通信电缆, 抗干扰能力强, 可靠性很高, 但是出现通信故障不易查找故障点, 维护工作量很大。

目前, 该省级供电企业所属的各地级公司的用电采集系统, 还处于在市区等用户密集地区建设阶段, 介于对通信可靠性的高要求, 本地通信方式主要采用RS-485通信, 这种通信方式对于城市等用户集中的系统比较适合。但是在今后的推广的过程中, 尤其是在用户不那么密集的偏远地区和农村地区, 无线通信方式的优势更为明显, 然而, 目前供电企业对于各种无线通信的安装调试和运行维护经验等方面还比较缺乏, 可通过建设相应的试点工程积累相关经验。

5采集终端运维现状分析

目前, 该省级供电企业终端已基本实现“全覆盖、全采集”, 但是还需要进一步加强管理和技术工作, 完成“全费控”目标。具体来讲, 各地市公司采用本地费控模式的集中抄表终端已被低压用户所接受, 其基本实现全费控, 采用远程费控模式的集中抄表终端由于技术原因并没有实现费控。在专变采集终端的费控问题上, 由于电力供应目前处于供需平衡甚至在某一时段处于供大于求的形势, 鼓励专变用户在保证不铺张浪费的前提下多用电, 各地市供电公司都没有在专变采集终端开通费控功能, 因此大部分专变采集终端并没有实现费控, 终端往往设置为“保电”状态。随着社会经济的发展, 为保证电能的有效利用与电费及时足额回收, 供电公司有必要充分拓展用电信息采集系统各项功能, 利用专变采集终端开展费控管理工作。

6运维管理现状分析

省级供电企业普遍对用电采集系统的建设和运维管理等方面的工作制定了详细的责任分工、人员配置和工作流程, 对整个系统的推广起到良好的指导作用。然而, 从几年的发展情况来看, 由于供电企业下属各级单位的人员素质、资源投入、环境因素等众多原因, 导致各地用电采集系统的建设和应用情况存在差异, 运行维护水平也各不相同。

大城市以及周边经济发展地区, 用户密集, 系统投入大, 技术队伍配备相对完善, 随着系统推广过程中遇到的各种问题得以解决, 技术人员和队伍都得到了充分的锻炼, 经验丰富。而与稍偏远地区和农网配套的用电采集系统的建设和运维经验相对缺乏, 系统的实施与应用仍然需要探索, 技术人员也不足, 这是今后供电企业在建设推广用电信息采集系统的过程中不得不面临的一个问题。具体存在的问题主要有以下两点: (1) 各地市供电公司从事采集业务的人员配备不足。绝大多数地市局并没有专设采集专责一职, 大多数地市局还由从事计量、业扩报装等业务的员工兼职从事采集业务, 造成各地市局采集业务的开展效率比较低下。 (2) 各地市供电公司从事采集业务的人员专业程度不够高。这是由于大多数地市局目前负责采集业务的员工原本从事的都是计量、业扩报装等业务, 这类员工往往具备的都是电力系统等强电知识, 对通信原理、计算机原理的知识储备量还不足。

7展望

通过上述对某省级供电企业用电信息采集系统运维工作现状的分析, 我们确信, 用电信息采集系统是电能计量向高级量测体系发展的重要组成部分, 因此作出以下展望:

(1) 通过更多的对系统的线上与线下进行运行维护积累经验, 提升相关人员的业务能力, 让相关人员对线下终端的安装调试、系统线上功能应用管理能够有更熟练的掌握和应用。 (2) 加强相关专业队伍的建设, 对线下终端的安装调试人员与系统主站功能应用, 管理人员作出明确分工, 尤其是安装调试与管理人员, 应更多的掌握相关方面的核心知识与技术, 能在厂家维护人员不能及时赶到的情况下自主地处理相关方面的问题。 (3) 加大力度投入光纤通信网络的建设, 逐步实现由以GPRS为主远程通信网络到光纤网络通信的转变;因地制宜的开展以无线通信方式为基础的本地通信网络试点, 为今后用电采集系统在农网的推广打下基础。

摘要:文章以某省级电力公司的用电信息采集系统为研究对象, 梳理系统运行维护工作现状, 从主站运维、通信信道运维到终端运维等层面进行了客观分析, 提炼出了现阶段存在的问题, 并提出提高运维工作水平的建议。

关键词:采集系统,终端设备,信号通道,现状分析

参考文献

[1]高犁.智能电网下的电力营销新型业务[M].北京:中国电力出版社, 2014.

[2]张晶, 徐新华, 崔仁涛.智能电网用电信息采集系统技术及其应用[M].北京:中国电力出版社, 2012.

[3]高犁.用电负荷管理[M].北京:中国电力出版社, 2011.

[4]徐金亮, 程必宏.用电信息采集系统技术与应用[M].北京:中国电力出版社, 2012, 9.

[5]国家电网公司新员工培训专用教材.用电信息采集系统[M].国网技术学院, 2015.

信息系统一体化运维体系研究 第8篇

在国家电网公司SG186 工程接近尾声之际, 作为新成立的蒙东公司, 需快速适应国网公司信息化建设需要, 落实SG186 工程要求, 跟上SGERP的建设步伐。但实际办公条件暂不满足信息化基础设施本地建设的要求, 于是利用网络带宽富裕的条件, 实现生产数据中心异地部署, 把北京作为主要生产数据中心, 部署协同办公、生产管理系统、ERP等业务系统;因银电联网、响应实时性需求, 营销管理系统及相关系统部署在赤峰;在通辽部署了计量中心系统。呼和浩特作为省公司的所在地, 网络中心部署于此, 形成了信息系统四地部署的局面。为更好的进行运行维护多地部署的信息系统, 国网蒙东信通公司积极探索多地运维体系的研究, 建章立制, 创新监控手段, 培养适应多地的运维人才, 采取多项措施, 实现一体化的运维体系。

二、研究背景

在信息化建设进程中, 建设了多个适应业务需要的信息系统, 覆盖电力行业的各个专业领域, 信息系统横、纵耦合程度逐渐加深, 迈入了领域多、层次深、耦合紧的阶段。

(一) 信息系统运行质量提高的需要。传统的运维体系是适应在省公司层面单地部署流程管控机制, 而面对多地部署暂不能改变的实际情况和分散运维的事实, 已不能满足业务信息系统对运行质量的要求。传统运维体系存在人员利用率低、人员需求量大、运维手段重复、运维水平发展不均衡、运维标准如何统一等诸多问题。变多地分散运维, 为一体化集中运维, 集中管控, 提高效率, 高效支撑信息系统高效运行是摆在国网蒙东信通公司领导班子及全体职工面前的一项重要课题, 也是提升运维水平的迫切需要。

(二) 信息系统统一安全防护的必然要求。信息安全是企业安全的一部分, 国家电网公司已把信息安全纳入“大安全”生产体系。信息系统安全防护是信息安全的一部分, 也是运行维护工作的重中之重, 系统的多地部署给安全防护带来了更高的要求, 传统单地部署, 只需要一套安全防护装备, 安全设备横向间即可完成防护联动, 而多地部署需要多套安全防护装备, 需要多套设备间横纵双向联动, 协同防护。

三、内涵和主要做法

通过建立组织、制度、技术、人才体系, 管理和技术并重, 以规划为依据, 建立一体化运维的运行模式, 支撑调、运、检、客服、日常管理五部分, 最终实现一体化运维目标。

(一) 组织体系

1. 目标。为达到一体化运维工作目标, 将公司和外部力量进行整体划分, 优化人力资源, 实现资源和绩效最大化。同时按照部门间的耦合程度, 划分界面和职责, 划定部门与部门间关系, 明确人员任务属性, 确定人员定位, 保证组织活动正常开展, 从而促进运维工作有效开展, 目标是实现一体化运维。

2. 组织架构。严格按照三集五大组织机构划分部门, 把外部力量纳入一体化运维管理范畴, 设定专责, 负责对运维队伍进行管理, 实现内、外部的有机结合。

(二) 制度体系

1. 目标。建立制度、职责、标准、流程、考核的“五位一体”机制。本着以总公司战略为导向, 以全面系统、清晰职责、约束与激励相结合为原则, 建立一套更加规范、有序、行之有效的制度体系。

2. 制度体系健全性。根据调运检体系的要求, 详细梳理信通调、运、检、客服、日常管理等5 个方面的内容, 细分为标准、制度、规范3 个层次, 对制度体系进行准确性、完整性、系统性规划, 确保运维各项工作有制度遵、有流程循、有标准依, 为信息通信运维的有序开展提供制度保障。

(三) 技术支撑体系

1. 目标。通过引进技术工具, 完善技术手段, 促进管理水平的提升, 确保业务信息系统的稳定运行, 从而发挥信息通信技术在电网中的支撑作用。

2. 运行方面。通过增加巡检频率, 开展功能巡检、性能巡检、双机改造、隐患排查提高运行可靠性。

3. 新技术引进方面。引进安全设备联动技术, 建立网络安全设备联动, 单台发现预警或攻击, 自动触发全网联动, 实现多地的一体化安全防护, 目前23 台安全防护设备, 全部加入联动网络, 实现内对内、外对内, 防病毒、防攻击、防泄漏等多范围、多种类的全方位安全防护。

(四) 人才体系

1. 目标。完善人才梯队建设, 制定人才规划, 发挥人才特长, 重点培养与普遍培养相结合, 鼓励人才展现, 技术人才与管理人才并重, 以创新工作室为依托, 允许边实践边成长, 给人才适度的空间, 达到人尽其才的目标。

2. 培训学习。利用网络大学, 开展不定期培训和考试, 实施岗位轮转, 外部考证激励等措施, 促进学习。在运维费用上向人才培训倾斜。

3. 人才培养。通过天天讲座, 开展人才锻炼, 通过考试选拔人才, 建立人才档案和培养规划, 重点在后备人才、专家人才、领军人才上下功夫, 比对上级评定标准, 明确目标, 争取在2 年内实现后备与专家人才实现零的突破, 3 年内, 实现领军人才零的突破。

四、实施效果

(一) 信息系统运行质量显著提高。通过一体化管控, 信息系统可用率达到99.993%, 比去年同期提升0.11 个百分点, 信息网络可用率100%, 较去年同期提升1.5 个百分点, 信息系统检修效率达到80%, 提升了30 个百分点, 信息系统检修回退率由5%, 降低至0, 误操作率由去年同期的6.2%, 降低到0.1%, 未发生信息系统八级及以上事件。

(二) 实现了信息系统的统一安全防护。实现了呼市、北京、赤峰、通辽四地的信息系统统一安全防护, 建立23台安全设备的有效统一联动机制, 减少了运维人员工作压力, 提升了安全防护水平。符合智能电网安全防护总体要求, 截止11 月底, 共拦截外部攻击22 万次, 攻击成功率为0, 拦截病毒和恶意代码12 万余个, 安全设备联动515 次, 体现了多地部署, 统一防护的高效协同。

(三) 提升客户服务满意度, 实现多赢良好局面。通过建立统一的呼叫中心, 提高用户满意度。客服受理及时率100%, 客户服务满意率98.4%, 较去年同期提升了4 个百分点, 从内部员工到外部用户, 满意度都显著提高。

(四) 加强检修管理, 增强检修规范性。通过系统提报检修, 并由调度组织召开检修平衡会, 每项检修, 必须执行工作票、操作票制度, 全年执行检修计划256 次, 合格率100%, 临时检修率和紧急抢修率均降低至0%, 检修规范性显著增强。

信息系统全业务集中运维的实践 第9篇

随着国家电网公司建设统一坚强智能电网和“三集五大”工作的进一步推进,客观上要求信息系统需为业务管理模式作强力支撑,并要不断适应集中化管控的要求,信息系统的建设和运维也将转变为大集中的管理方式。

浙江省电力公司(以下简称浙江电力)信息技术中心自2007年成立以来,承担起了全省应用系统的运维工作,将运维工作分为业务运维和平台运维,分别由2个职能处室管理。为满足系统运维集中化、运维管理规范化、运维管理标准化、运维质量均一化的管理要求,浙江电力信息技术中心于2010年积极探索并开始建设全业务大集中基地式运维管理模式。

1 总体范围与目标

1.1 理念和策略

以往系统运维集中管理局限于单个独立系统从分布式到省一级集中运维,这个阶段可以被看成是系统运维的物理集中。但随着电网各项业务横向贯通,各个应用系统间数据交叉访问频繁,即需要系统运维的逻辑集中。为适应这种新情况,并更好地为业务部门服务,浙江电力信息技术中心创造性地提出了全业务集中运维的管理模式。全业务即包括公司系统所有业务信息化系统;集中运维即包括设备运维、业务支持、需求分析、变更消缺等工作,力求充分利用各个系统的运维人员资源,打破以往系统间由于开发商所造成的工作壁垒,由信息技术中心统一调度管理,进而可以整合多种资源,拓展运维的深度和广度,有效提高运维效率,提升信息技术中心应急响应、对外服务的能力。

1.2 范围和目标

全业务的集中运维涵盖了浙江电力目前在运的大多数应用系统,包括ERP系统、营销系统、生产管理系统、协同办公等在内所有省级集中的核心业务系统。通过统一制定标准化管理规范,梳理出适用于不同系统运维管理标准流程,并使用统一的考核标准来量化各系统的运维工作。进而提高服务质量,规范运维工作,提高系统可靠性。

2 主要措施

2.1 建设集中运维基地,提升运维资源利用率

2.1.1 人员集中管理

从以往信息化项目建设的经验来看,基地式集中管理的模式很适合大型软件系统项目统一管控,而实践表明,这种管理模式也适用于大型软件系统的集中式运维。首先,通过这种模式,不仅将大部分应用系统的运维人员集中到运维基地来办公,统一规范各个运维岗位的工作职责,对运维人员的工作进行集中管理和约束,实现运维管理的标准化。其次,有效处理各运维岗位的敏感性操作和非敏感性操作,坚持“核心技术掌控于我”,以集中化高水平管控确保核心业务、数据和信息的安全,彻底杜绝了分布式运维过程中的安全风险。再次,不仅可以有效统计运维人员工作量,更能在不同团队间有效调配运维人力资源,达到运维人力资源的统一整合和调度,提高工作效能。

2.1.2 加强专业运维团队建设

通过全业务集中运维团队的构建,组成了分工明确、相互协作支持的专业运维队伍,集聚各专业的优秀人才,具有全面的知识结构优势,形成了强大的运维力量。并且在团队内建立了培训与交流学习、外部专业培训、内部导师带徒、典型运维案例定期分析等制度。好经验、好点子能够快速推广,形成了优势互补和团队协作,使得零散知识迅速整合为系统集体智慧,取长补短,共同进步,提高运维能力。

2.1.3 人力资源有效整合与合理配置

在以前的分布式运维管理中,运维人员在各系统之间存在业务交叉配置,相似的工作内容存在岗位重复、人员重复等现象,但因为厂商的壁垒,各系统之间人员不能调用、复用,造成人力浪费。同时由于人员管理不受中心掌控,往往存在某个业务模块过度依赖某个或者若干个厂商人员的局面。

集中运维之后,中心对各系统运维岗位和人员配置进行了重新梳理,对于跨系统的交叉业务岗位进行合并复用,不仅增加了运维团队的总体工作量,也使每个运维人员的工作负荷更为合理,人均工作量提升较大,达到1+1>2的效果。

同时,最重要的是,在集中运维团队中采取了知识共享、岗位互备等措施,关键岗位主业人员培训后运维能力提升,过于依赖厂商个别人员的局面大大改观,现在的团队内部能实现关键业务模块运维资源的相互补位与协作,使运维风险大大降低。

3 统一运维标准,拓展运维广度和深度

3.1 严格执行一单两票制度

在集中运维之前,每个系统都分散管理,各有自身一套运维流程,很多流程相互脱节或缺失,无统一执行标准。为达到运维规范的标准化,梳理并统一了所有业务系统的运维流程,统一制定了运维岗位的工作职责、岗位权限和操作范围,使运维人员的各项运维操作都有据可依,便于管控。

集中运维要求各系统严格按照两票制度开始进行发布的操作,解决了原先应用系统发布两票操作比较薄弱的问题。按照国网统一模板制定检修计划,要求每次检修都详细说明检修原因、检修内容、影响范围、关键操作和应急措施。审批通过后严格按照计划时间停启系统,工作负责人和操作人都同时到现场进行检修工作,检修完成后,还对本次检修工作进行总结,提炼出相关操作的危险点和应急处理措施,以备日后相同的检修操作能避免出现同样的问题,减少信息系统安全运行风险。

3.2 统一的用户服务门户

通过集中运维管理工作,建设了2186统一用户服务门户,使2186客服人员的工作内容从以往单纯的桌面报修受理扩展到所有应用系统运维故障报修和运维事件受理的统一入口(见图1)。

通过统一服务标准和服务流程,集中运维基地针对实际客服工作制定了相应的工作规范、工作手册等。并通过开展客服人员规范用语、电话礼仪培训、集中运维业务知识培训、内部顾问模拟电话接听问答等各种形式来帮助2186客服人员快速提升服务素质和服务意识。而对用户,不管是桌面的问题、系统平台的问题还是业务系统本身的应用问题,只要拨打统一的2186电话,由统一的2186服务人员提供一线技术支持,做到了信息系统服务的“单点登录”,极大地提高了用户服务的效率,提升了信息服务的用户体验水平。

3.3 统一的ITSM运维管理平台

在统一运维入口、统一运维规范和流程、考虑各系统的运维等级等前提下,开发了符合ITIL标准的信息服务管理系统,涵盖了事件管理、问题管理、发布管理、配置管理、变更管理等ITIL核心流程相关功能。

在标准化流程的基础上,对每个环节的处理定义赋予明确的角色权限。结合2186统一运维入口,2186客服人员在接到电话报修后,把运维事件实时录入到信息服务管理系统,并以工单的形式派发给相关系统的相应运维人员处理。这种统一运维入口、统一运维平台的集中运维新模式,一方面有利于统一各系统间相同服务请求的处理流程和相应审批的管理要求,使客户感受相同的系统运维的服务水平和质量,另一方面也有利于在统一的考核标准下对各系统的运维工作量进行客观评估。

3.4 统一的大集中运行,推动主动式运维

电网企业在信息系统管理上的普遍现象是“重建设、轻应用”,“重硬件、轻软件”,业务系统的运维工作经常被认为是一个查漏补缺、修补错误的辅助工作。从信息系统的完整生命周期来说,项目建设只是信息系统生命周期中的一个环节,一个系统真正发挥作用,体现效益都是在日常运行使用中,能让用户用好业务系统,使业务系统成为增加业务价值的重要工具,是电力信息部门提升管理工作水平,甚至提升自身工作价值的重要途径。

“主动式”的IT运维管理模式,就是根据IT全生命周期管理的要求,从系统规划阶段就开始介入,统一规划运行维护的工作,改变原有运维工作等、靠、要的被动状态(例如:等项目、等需求、靠建设方提供、需求方决定、要资金、要人员、要技术),变为依托系统监控和故障分析,以可靠性分析和状态预警分析为核心的主动式工作管理规划,消除故障的源头,切实加强系统运行的可控、在控和能控。这种新型的管理模式融合进全业务集中运维这个平台后,才真正凸显其管理效益。

在日常系统运维的基础上,积极拓展运维广度和深度,加大对业务部门的系统技术支持,从系统技术支持角度积极配合业务部门开展其业务工作。真正开始让信息部门从“管设备、管系统”向“为公司业务价值实现提供关键支撑”的角色转变,也极大地提升了信息部门的业务价值。

4 扁平化管理,提高工作效率

4.1 信息传达、执行的效率提高

全业务集中运维之前,各系统的运维团队分散在各处办公,且各系统在信息技术中心的主管部门不统一,但各系统之间又存在千丝万缕的关联和接口。信息的传达无论在系统之间的横向传达还是从下到上的纵向传递都不够通畅。往往由于某个系统的业务调整或开发变更,影响到有关联的其他系统,而被影响的系统甚至还不知道出错的原因。这种分散的、各自为政的运维模式,不但工作效率低下,还影响到信息系统的稳定、可靠运行。

集中运维以后,各系统运维人员、资源统一规划和调配,每周召开集中运维周例会,各系统运维主管汇报各自系统一周的运维工作情况,讨论和协调各系统之间存在的问题、协商解决的方案等。各级领导可以清楚了解本周运维工作详情、存在的难点和问题和下周计划,从而管控各项工作进度和质量。这种集中化、扁平化的管理方式,使信息传达更加有效,也极大地提高了工作效率,提升了信息系统运行的稳定性和可靠性。

4.2 加强系统间信息互享,提高协同运维能力

随着“三集五大”业务管理模式的深化,各业务应用系统间联系越来越紧密,实际运维工作中出现系统间交叉影响。所以传统模式下只关注某个系统的独立运维,已不满足当前的形式,应将所有系统虚拟为一个大系统来统一考虑运行、调度和检修工作。

集中梳理和编制了《信息系统数据交换汇总图》,通过该汇总图可以直观地反映本系统与其他外部系统间数据交换情况,特别是对于重要系统接口和与国网系统纵向贯通的接口,在日常运维的巡检、监控和预警时给予特别关注,并要求各系统在进行检修操作、业务流程、数据工程等重大变更时,需要及时通知相关有接口的其他系统,保持各系统间信息互通和数据的一致性,提升系统的稳定性和可靠性。

5 结语

浙江电力信息技术中心作为国家电网公司信息系统调运检体系试点单位之一,在不断探索在调运检体系下如何高效开展大运行工作取得了一定的成效,但随着国网“三集五大”的进一步深化,企业对信息化的需求不断提高,对信息系统的运维提出了更高的要求,信息运维团队的技术和能力只有更进一步提高才能适应企业发展的需要。应加强运维团队的建设,通过工作环境、待遇改善,开展集体活动,团队凝聚力打造等多方面的努力,力求保持一支战斗力强、凝聚力高,充满活力和集体感的运维团队。同时也关心团队成员的个人事业发展,做好人才梯队和积累工作,实现“以空间留人,以发展留人”,保持运维团队的相对稳定性。

开展多种形式的培训,特别是各系统业务知识和系统技术架构方面,也可以对当前IT发展的前沿技术,聘请专家来对运维团队进行充电。同时着重开展标准培训体系的建设工作,力求将运维人员的培训内容标准化,从而能更好地保证培训的质量和效果。通过滚动式、长期性、灵活多变的培训方式来提升运维人员的个人能力,进而提高团队间的人才复用程度。

积极研究与学习电信、金融行业信息部门作为业务价值支撑部门的优秀经验,结合IT服务管理向业务服务管理迈进的趋势,以更高的标准要求自己,在体制、机制、流程、团队建设等方面进行努力,更好地为电网企业价值实现提供关键支撑。

摘要:作为国家电网公司信息系统调运检体系试点单位之一,浙江电力不断探索在调运检体系下如何开展大运行工作。随着业务系统之间交叉联系越来越紧密,单独系统的运行已不能满足运维的要求,集中运维成为必然的发展趋势。根据多年实际运维工作经验,浙江电力信息技术中心提出了全业务集中运维的管理模式,通过统一集中的专业化运维团队,实现运维流程规范标准化,采用统一运维管理系统平台和集中式2186服务台等一系列管理措施,充分整合各系统的运维资源,强化业务为导向运维,积极拓展运维的深度和广度,有效提高了工作效率及运维能力和对外服务能力。

关键词:信息系统,调运检体系,集中运维

参考文献

[1]博恩.IT服务管理——基于ITIL的全球最佳实践[M].北京:清华大学出版社,2006.

[2]蒋国瑞.IT项目管理[M].北京:电子工业出版社,2011.

[3]林小村.数据中心建设与运行管理[M].北京:科学出版社,2010.

[4]刘宇熹,陈尹立.IT服务外包理论方法与实务[M].北京:清华大学出版社,2010.

信息网络运维监控系统的应用 第10篇

1 系统介绍

信息网络运维监控系统通过树立面向业务服务的运维管理理念, 建立科学合理的绩效考核指标, 实行集中统一的信息系统运维管理模式, 将信息运维由分散管理向集中管理转变, 由无序服务向有序服务转变, 由职能管理向流程管理转变。利用先进、实用、高效的信息运维管理工具, 由被动管理向主动管理转变。下面就系统涉及关键技术进行介绍。

1.1 SNMP

简单网络管理协议 (Simple Network Management Protocol, SNMP) 的前身是简单网关监控协议 (Simple Gateway Monitoring Protocol, SGMP) , 由一组网络管理的标准组成, 用来对通信线路进行管理。随后, 人们对SGMP进行了很大的修改, 特别是加入了符合因特网定义的管理信息架构 (Structure Of Management Information, SMI) 和管理信息库 (Management Information Base, MIB) 体系结构, 改进后的协议就是著名的SNMP, 用以监测连接到网络上的设备是否有任何引起管理上关注的情况。SNMP的目标是管理互联网上众多厂家生产的软硬件平台。现在SNMP已经出到第三个版本的协议, 其功能较以前已经大大地加强和改进了[1,2,3]。

1.2 MIB

MIB是在网络管理系统中极其重要的部分, 是指在管理代理中包含且可以被管理工作站查询并设置的各类信息的集合。管理代理能访问管理信息库, 对管理信息库的操作是通过SNMP网络管理协议来完成的, 管理代理和管理工作站之间的连接也是通过SNMP网络管理协议来完成的。管理信息库使用层次型、结构化的形式, 为了保证本地当前的设备和标准的网络管理协议相一致, 就必须按要求使用其中定义的格式来显示信息[4]。

1.3 Solarwinds系统

Solarwinds系统是基于简单网络管理协议SNMP的一款全球领先的网络管理软件, 可在一台计算机上实现远程管理所有支持这种协议的网络设备, 包括监视网络状态、修改网络设备配置、接收网络事件警告等。它的用途十分广泛, 涵盖了从简单、变化的PING监控器及子网计算器到更为复杂的性能监控器和地址管理功能, 大幅的简化网管工程师对于网络的管理工作负担与提升效率。

2 系统应用

石西油田网络设备部署分散, 点多面广, 涉及设备有路由器、交换机、无线网桥等, 通过信息网络运维监控系统的应用, 实现设备的全面的可视化管理。

2.1 被监控设备SNMP协议启用

以配置交换机为例:

snmp-agent

snmp-agent community read******

snmp-agent sys-info version v2c

其中******为通用团体字字符串, 在确认字符串一致后服务端对交换机信息进行读取[5,6]。

2.2 运维监控应用

信息网络运维监控信息收集模块包括有当前响应时间、CPU利用率、内存利用率、端口利用率、错误和丢包率每小时等, 所有信息配有趋势图方便工作人员进行纵向比对, 如图1所示。

信息网络运维监控系统信息查询包括设备节点状态、活动告警、最近的25个事件等, 如图2所示。

2.3 网络性能报警

监控网络性能时可以利用警报来引起对某些事项的注意, 其中包括未预料的持续的高CPU、有效内存的丢失、设备宕机等, 通过设置不同的触发值及重置值。当监控的系统性能参数超出触发值时, 按照管理员制定的处理方式 (电子邮件、手机短信等) 自动报警或动作处理, 当性能恢复正常, 达到重置值时, 告警自动消失。对于发生的故障事件能进行自动关联, 给出分析后的故障原因, 有助于管理员在最短时间内解决问题[7,8]。

2.4 网络故障管理

网络故障统一监控管理, 实现跨专业的告警相关性分析, 能够迅速对发生的告警进行定位及判断, 维护人员可以在最短的时间内找到问题根源, 迅速排除故障, 保障业务质量。同时, 对各类告警的实时采集、综合处理和数据存储, 并以可听、可视等方式从多个角度实时监视全网当前的活跃告警;能够以各种组合条件对全网历史告警进行查询和统计分析;能够对告警的产生、清除、故障派修等信息进行及时分析与了解, 及时发现和排除故障。

3 结束语

通过信息网络运维监控系统在油田网络中的应用, 对网络可用性、带宽使用率、网络延时、CPU和内存使用情况、节点端口状态等方面都提供了很好的监控功能, 能够及时监测、发现网络中存在的种种问题, 保证了业务稳定运行、提高运维工作效率, 它正在改变各类规模的企业监控和管理其企业网络的方式, 实现资源的整合管理, 形成了信息服务的一体化管理模式。

参考文献

[1]李育青.网管系统在油田主干网的应用研究[J].信息技术, 2010, 8:158-159.

[2]丁健, 毛娜, 荆晓娟, 等.网络智能运营体系研究[J].通信技术, 2013, 3:65-66.

[3]范斐, 赵辉, 鲍忠贵, 等.一种新型综合网络管理模型的研究与设计[J].通信技术, 2011, 3:108-109.

[4]赵洁, 李成海.基于数据库的IP网络管理研究[J].通信技术, 2009, 10:108-109.

[5]刘霁莹.一种安全网络管理协议的设计与实现[J].信息安全与通信保密, 2012, 8:110-111.

[6]沈建宇, 李建华, 张月国.基于事件流的网络安全事件监控系统[J].信息安全与通信保密, 2010, 2:92-93.

[7]邓伟华, 田永春.多层立体网络基于用户特征的切换方法[J].通信技术, 2010, 1:167-168.

运维管理系统平台作用 第11篇

关键词 :运维 标签 网络 信息

随着社会的网络信息化覆盖面越来越广,通信机房的设备越来越综合化、多样化,越来越多的远端机房的应用,机房的规模随之增大,面对大面积、远端的通信机房、众多的设备、大量的日志,传统的标签、书面记录、视频、网管系统的应用,传统的运维管理模式已经不能满足目前通信的实际需求,必须寻求一种现代化的软件来代替原有传统的运管模式,使得复杂、多样的运维管理能够简单化,从而提高故障处理、资料管理、数据查询、设备监管等工作效率。由此我们进行一些探索和尝试。

主要功能

1、站点导航

为使得长江沿线通信机房均能使用运维管理系统,软件考虑设计了站点导航功能,通过站点导航的图片,可以轻松地导航到长江沿线的各个机房,实时查看到机房内的资料,以及业务管理情况。

2、运维规范

任何工作都有其规章制度,规范、流程对于运维管理来说更为重要,如果期间出现差错,将会带来很大的损失。规范、流程应及时更新,在功能设计时,应该提供可更新、添加功能。其次,规范应能轻松进行查阅,当运维工作人员遇到紧急业务时,可快速查阅。

3、设备管理

通信机房,最重要的莫过于设备资料的管理,随着设备越来越多,通过原先的标签和文档来注明各种资料已经完全不能满足要求,一方面,资源不能很好地共享,经常出现设备资料只有固定的少数几个人掌握;另一方面,由于设备集成高,体积小,端口多且复杂,电路的来龙去脉比较繁杂;再则综合机房、远端机房温度偏高,随着时间的推移,端口标签经常会出现脱落现象,由此也给设备判断带来困难。

鉴于此,设备资料通过信息化管理更为合适,不仅能够解决上述困难,而且给运维工作人员减轻负担。

4、值班信息

值班信息主要功能是对机房日志资料的管理,通过包括值班记录和基础数据,值班记录是对值班信息的实时电子记录,实现用电子台帐来代替传统的文本台帐。利用电子台帐来进行管理运维日志后,可实现日志的数据库管理,可以轻松进行统计和查询,可方便实现月度、季度、年度或者任意时间段信息的统计,同时也提高值班记录的痕迹管理,加强了值班、维护人员的工作责任性和自觉性。

5、故障处理

维修记录主要实现设备维修的记录历史,各个设备有各指示灯对设备其运行状况、端口属性和特性指导作用,工作人员根据设备技术说明书、对其日常维护和故障处理经验,进行相应的记录,同时系统会自动统计该设备的出现故障的处理方式以及出现次数的多少,根据记录,当日后当再次出现故障时,可根据该系统功能模块进行逐一排查、比对,对其常见故障进行优先检测,从而提高故障的处理效率,缩短故障时间,减轻工作人员的负担。

系统展望

运维管理系统实现以上功能投入使用后将会大大提高运维机房的工作效率,但我们感觉到系统的功能要不断更新,不断适应现代化机房的发展需求,结合我们近期工作的情况,还探索要解决以下三个问题:

设备编码问题。目前通信机房的设备五花八门,新产品越来越多,如何对设备进行科学合理的分类,成为运维系统的一个非常重要的问题,面对沿江全线通信机房成千上万的设备,全部用设备名称加以区别显然不可行。必须通过科学的分类和编码手段进行标准编码。

通信机房的图形化管理。为让更多用户理解和熟练应用软件,界面必须友好、简洁。运维管理系统最能让工作人员快速上手的界面应该以图片导航的方式来实现,但图片实现相对较复杂而且不利于今后升级。

中小企业信息系统远程运维管理研究 第12篇

改革开放以来, 中小企业在我国蓬勃发展。截止2013 年三季度末, 全国工商注册的中小企业总量超过4200 万家, 占全国企业总数的99%以上, 占全国GDP产值的58.5%, 在促进国民经济平稳较快增长、缓解就业压力、实现科教兴国、优化经济结构等诸多方面, 均发挥着越来越重要的作用[1]。随着信息化技术的发展, 我国中小企业也经历了信息化浪潮的洗礼, 基本完成了信息系统的建设, 实现了传统经营方式的转变, 节约运营中各项业务成本, 提高工作效率, 实现企业自身的快速发展。然而, 中小企业由于资金短缺, 信息技术人才基础薄弱等原因造成信息系统运维管理的情况并不理想。与拥有中心机房的大企业不同, 大部分中小企业信息系统主要部署在一个或少数几个硬件服务器之上, 实现公文流转、财务管理、人力资源管理等基本功能, 运维管理人员也是由一名或少数几名工程技术人员提供运维管理, 不可能提供与大企业一样7*24 小时不间断的运维服务, 因此, 如何利用现有的技术, 为中小企业工程技术人员提供远程运维管理, 减少企业成本, 提高运行效率将是本文研究的重点。

2 远程运维管理

要实现信息系统远程运维管理, 首先需要了解系统的运行状态, 因此, 监控数据必须能自动采集, 形成结果文件, 工程技术人员通过互联网访问查看结果文件, 并发送运维指令, 同时, 在信息传输过程中对信息进行加密, 保证信息传输安全。下面将介绍几种技术以实现上述功能。

2.1 Nagios监控软件

Nagios是一款开源的电脑系统和网络监视工具, 能有效监控Windows、Linux和Unix的主机状态, 交换机路由器等网络设置, 打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员, 在状态恢复后发出正常的邮件或短信通知[2]。

Nagios与监控对象之间的关系如图1 所示, 虽然其功能是监控网络服务 (如SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP等) 和主机资源 (如CPU load、disk usage、system logs等) , 但是他自身并不包括这部分功能, 所有的监控、检测功能都是通过各种插件来完成的。启动Nagios后, 它会周期性的自动调用插件去检测服务器状态, 同时Nagios会维持一个队列, 所有插件返回来的状态信息都进入队列, Nagios每次都从队首开始读取信息, 并进行处理后, 把状态结果通过web显示出来。Nagios可以识别4 种状态返回信息, 即0 (OK) 表示状态正常/绿色、1 (WARNING) 表示出现警告/黄色、2 (CRITICAL) 表示出现非常严重的错误/红色、3 (UNKNOWN) 表示未知错误/深黄色。Nagios根据插件返回来的值, 来判断监控对象的状态, 并通过web显示出来, 以供管理员及时发现故障。

2.2 NAT技术

Nagios软件可以完成监控数据的自动采集。对于具有对外提供信息服务的中小企业来说, 工程技术人员可以通过访问对外信息服务主机查看Nagios结果文件。而对于只面向内部提供信息服务的中小企业来说, 系统主机所使用的地址都是内部的IP地址, 工程技术人员如何才能通过互联网查看Nagios软件的采集结果并发送运维指令, NAT技术将可以解决这个问题。

NAT (Network Address Translation) 技术是指在一个网络内部, 根据需要可以随意定义的IP地址, 而不需要经过申请。在网络内部, 各计算机之间通过内部的IP地址进行通讯。而当内部的计算机要与外部Internet网络进行通讯时, 具有NAT功能的设备 (比如:路由器) 负责将其内部的IP地址转换为合法的IP地址 (即经过申请的IP地址) 进行通信[3]。

与租用昂贵vpn专用线路相比, 向网络运营商租用一个在Internet公网上的IP地址的成本对中小企业来说就显得微不足道了。工程技术人员可以通过对具有NAT功能的路由器进行设置, 使内网上安装有Nagios软件的内部主机地址静态映射成Internet网络上的IP地址, 这样, 工程技术人员就可以通过访问Internet网络上的IP地址来查看Nagios软件的结果文件。

2.3 信息安全

对于在Internet网络上传输的数据来说, 信息安全一直是关注的重点。如何保证传输的数据不被篡改, 对传输数据进行加密的密钥技术以及数字签名等技术可以很好的保证传输数据的安全。

密钥有两种分类:对称密钥与非对称密钥。

对称密钥是指信息的发送方和接收方使用同一个密钥去加密和解密数据。它的最大优势是加/解密速度快, 适合于对大数据量进行加密, 但密钥管理困难。非对称密钥是指使用不同的密钥来进行加密解密, 一个公开发布, 即公开密钥, 另一个由用户自己秘密保存, 即私用密钥。信息发送者用公开密钥去加密, 而信息接收者则用私用密钥去解密[4]。只要接收者的私用密钥不解密, 即使发送的信息被截获篡改, 在接收端也可以很快的发现。

对于远程运维来说, 通过在Nagios主机端安装私有密钥的验证服务, 对用户身份进行验证, 可以防止非法入侵, 保证信息系统及传输数据的安全。

3 总结

本文通过分析中小企业信息系统运维管理的困境, 提出了一种利用Nagios软件完成数据采集、NAT技术实现地址转换以及密钥技术保证信息系统及传输数据安全的远程运维技术解决方案。该方案具有低成本, 高效率的特点, 具有广阔的发展前景。

参考文献

[1]赵晓晖.我国中小企业信息化发展现状与对策研究[D].秦皇岛:燕山大学, 2013.

[2]王帆.基于Nagios的服务器监控平台构建与实现[J].实验室研究与探索, 2010, 12 (12) :51-57.

[3]李广华, 朱志祥, 李振兴.NAT技术基本原理及其在实际中的应用[J].西安邮电学院学报, 2009, 6 (1) :91-95.

上一篇:加工中心刀具的选用下一篇:审计人员素质