应用系统应急预案

2022-08-12

第一篇:应用系统应急预案

信息系统应急预案

信息科中心机房故障应急预案

为科学应对网络与信息安全突发事件,提高信息中心机房处理突发信息网络事件的能力,建立健全信息安全应急机制,有效预防、及时控制和最大限度地消除信息安全各类突发事件的危害和影响,特制订信息中心机房故障应急预案。本预案坚持“统一领导、协调配合、明确责任、依法规范、条块结合、整合资源、防范为主、加强监控”的原则。适用于信息中心机房可能发生的网络与信息安全突发事件。

一、机房漏水防治应急预案⑴ 发生机房漏水后,第一目击者应立即通知网络与信息安全领导小组。⑵ 若空调系统出现渗漏水,应立即停止故障空调,将机房内的积水清除干净,并及时联系设备供应方进行处理,必要情况下可以临时用电扇对服务器进行降温。⑶ 若为墙体或窗户渗漏水,应立即通知行总务处,及时清除积水,进行墙体或窗户维修,避免不必要的损失。

二、设备发生被盗或人为损害事件应急预案⑴ 发生设备被盗或有人为损害设备情况时,使用者或管理者应立即报告网络与信息安全领导小组,同时保护好现场。 ⑵ 网络与信息安全领导小组接报后,通知安全保卫部门及公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。⑶ 事件当事人应当积极配合公安部门进行调查,并将有关情况向网络与信息安全领导小组汇报。⑷ 网络与信息安全领导小组召开会议研讨,事态严重时,应向市教育局网络与信息安全领导小组办公室报告,请示进一步处理的决策。

三、机房长时间停电应急预案接到长时间停电通知后,应及时通过局域网发布或电话通知停电通告,要求医院网用户在停电前停止办公、保存数据并正常关机。

四、不良信息和网络病毒事件应急预案⑴ 当发现不良信息或网络病毒时,网络管理员应立即断开网线,终止不良信息或网络病毒传播,并告知网络与信息安全小组。⑵ 接到报告后,网络与信息安全小组应立即通告局域网内所有计算机用户防病毒方法,隔离网络,指导各计算机操作人员进行杀毒处理,直至网络处于安全状态。⑶ 对不良信息要进一步追查来源,对未经相关领导同意,擅自发布信息,造成不良影响且触犯法律者,移交执法部门追究法律责任。

五、计算机软件系统故障应急预案⑴ 发生计算机软件系统故障后,计算机操作人员立即保存数据,并停止该计算机使用应用。⑵ 由部门负责人将情况报告网络与信息安全小组,不得擅自进行处理。⑶ 网络与信息安全领导小组迅速派出技术人员进行处理,必要情况下,应对硬盘进行备份。⑷ 在保持原始数据安全的情况下,对计算机系统进行修复;修复系统成功,则检查数据丢失情况,利用备份数据恢复;若修复失败,立即联系相关厂商请求支援。

六、机房设备硬件故障应急预案⑴ 发生机房设备硬件故障后,网络与信息安全领导小组应立即确定故障设备及故障原因,并进行先期处置。⑵ 若故障设备在短时间内无法修复,应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。⑶ 故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,并认真填写设备故障报告单备查。

七、应急通讯保障网络与信息安全小组全体人员保证全天24小时通讯畅通。

八、装备保障应预留一定数量的信息网络硬件和软件设备,指定专人保管和维护。

第二篇:售票系统应急预案

安徽天柱山旅游发展有限公司

售票系统应急预案

为建立健全景区售票系统应急保障体系和运行机制,快速、有效地处理售票系统的安全事故和突发事件,根据风景区实际特制定本预案。

本预案适用于景区售票系统因网络、设备、软件、电力等故障或遭受大规模“病毒”感染、非法入侵及其它不可预测的因素导致售票系统中断或售票异常的安全事故和突发事件。

一、 组织机构及职责

1、 应急组织机构

公司成立售票系统安全事故和突发事件应急处置领导小组(以下简称“应急处置领导小组”),由 任组长,公司办公室、稽查办、财务科、茶庄游客中心、大龙窝索道公司、天柱山客运公司、执法大队、信息技术中心为组员单位。

2、 应急处置领导小组主要职责

(1)根据事件的影响范围和严重性决定是否启动应急预案,遇重大情况负责及时向上级领导报告。

(2)负责售票系统安全事故的应急处置、治安保障、系统恢复、后勤保障、新闻发布等工作。

(4)保管备用纸质门票、车票。

(3)负责向售票系统相关技术支持单位请求技术支持。

二、 应急响应、处置

售票系统中断运行由信息技术中心检查处理,在15分钟内不能恢复运行的须立即报告应急处置领导小组,启动应急预案。

1、公司办公室向领导报告启动预案。

2、游客中心通知售票员向大堂经理领取应急备用纸质门票、车票准备销售,并通过电子显示屏、展牌等媒介向游客进行解释宣传。

3、 稽查办负责通知各检票口做好纸质门票、车票检验准备。

4、执法大队负责现场秩序维护。

5、财务科负责向管委会财务科报告,并做好纸质门票、车票的领退与分发工作。

6、 信息技术中心负责售票系统的维修与相关技术单位的协调。

三、 后期处置

售票系统恢复运行后,应急处置结束,由应急处置领导小组宣布应急结束,稽查办通知各检票口进行正常电子票检验。 应急处置结束后2日内,由售票系统应急处置领导小组组织力量对事故的起因、性质、影响、责任、教训和处置进行评估,提出整改和预防措施,完善应急预案,并做好对上级部门的汇报。

附件:售票系统应急处置领导小组人员及联系方式

2015 公司办公室

稽 查 办 财 务 科 茶庄游客中心 大龙窝索道公司 天柱山客运公司 信息技术中心 执法大队

安徽天柱山旅游发展有限公司

年9月18

第三篇:征信系统应急预案

上饶县福田小额贷款有限公司征信系统应

急预案

一、总则

1.1目的

本预案旨在全面提高应对金融生产系统中各种突发事件的能力,提供科学的指挥方案,最大限度地减少突发事件所造成的业务停顿时间。力争在最短的时间内恢复系统运行,保证生产系统的稳定、安全运行。

1.2工作原则

1.2.1 贯彻统一领导,分级负责,反应及时,措施果断,依靠科学,加强合作的原则。金融系统故障具有突发性强、影响大、范围广的特点,一旦出现重大故障必须在行领导的统一指挥下,以运行维护部门为中心,相关部门积极配合,协同作战,迅速反应,最大限度地保证业务的连续性和安全性。

1.2.2 遵循预防为主,常备不懈的方针。做好应对突发事件的思想准备和思想教育;加强生产系统的日常监控;通过技术创新和技术进步完善监控和预警手段;加强专业队伍建设和培训;制定完善的单项应急处理流程,提高处理速度。定期进行预演。

二、组织结构与职责

金融技术应急组织机构由突发事件领导小组,突发事件应急办公室和各技术应急小组构成。

2.1应急领导小组。

应急领导小组由相关技术领导组成,负责重大故障应急对应的决策。

2.2 应急办公室。

2.2.1应急办公室由技术部与科技部。 2.2.2应急办公室工作职责。

1) 贯彻执行上级领导部门的工作部署。 2) 进行生产环境安全教育,定期演练。 3) 组织安全检查;监督应急措施的落实和整改。

4) 遇到故障发生,协调相关各部门、和人行相关部门,行使指挥职能。

2.3技术应急小组。

2.3.1技术应急小组由技术部门的运行维护技术人员组成。2.3.2技术应急小组职能。 1) 制定具体的应急措施,不断完善应急措施。 2) 24小时监控系统运行,发生故障及时预警、上报。 3) 执行上级制定的应急措施。

技术应急小组由市局信息技术中心和科技部组成。

三、监测和预警

3.1故障监测与预警发布

3.1.1 监控。建立了网络和主要设备、系统的运行监控系统,一旦发生故障,会产生声音报警。其他设备和系统采用设备巡检制度,定时对设备运行状态进行记录。

3.1.2监控部门一旦发现故障报警,要及时应急办公室。应急办公室按上报的故障分类和级别,组织应急处理。

预警级别在二级(含二级)以上报应急办公室,由应急办公室上报应急领导小组。

当故障预警的应急处理在规定的时限内没有处理完成,或故障预警级别上升,则由应急办公室启动相应级别的应急处理,超过二级预警上报应急领导小组。

3.2预警级别 3.2.1网络

一般预警:预警级别为四级。部分线路发生故障,导致业务无法进行。预警信息用蓝色表示。

较重预警:预警级别为三级。主干线路发生故障,或网络汇接设备发生故障,导致某台PC业务全部瘫痪。预警信息用黄色表示。

严重预警:预警级别为二级。一条骨干线路或部分网络设备发生故障,导致业务停顿1小时以上。预警信息用橙色表示。

特别严重预警:预警级别为一级。全部骨干线路;主、备网络设备设备出现故障,导致业务在短时间内无法进行。预警信息用红色表示。

3.2.2 设备 一般预警:预警级别为四级。外围系统硬件设备或核心系统硬件设备只是产生硬件故障报警,出现了设备故障的提示。预警信息用蓝色表示。

较重预警:预警级别为三级。外围系统硬件发生故障,但业务仍可维持进行。预警信息用黄色表示。

严重预警:预警级别为二级。核心系统一台主机出现重大故障,无法运行;或部分外围系统出现严重硬件故障而导致业务停止。预警信息用橙色表示。

特别严重预警:预警级别为一级。发生不可预测性自然灾害,导致省中心机房严重破坏;或核心主机、存储等出现重大故障,无法运行(主、备机均无法运行)。预警信息用红色表示。

3.2.3 系统

一般预警:预警级别为四级。外围系统cpu、内存、网络和存储等资源占用较大,导致网点交易缓慢。预警信息用蓝色表示。

较重预警:预警级别为三级。储蓄主机系统cpu、内存、网络和存储等资源占用较大,导致网点储蓄等主要交易缓慢;外围系统cpu、内存、网络、存储等资源占用严重,导致部分或全部前端交易无法进行,并且故障在1小时内无法解决的。预警信息用黄色表示。

严重预警:预警级别为二级。储蓄系统出现严重的交易堵塞现象,网点业务无法正常开展,并且在1小时内没有解决;外围系统出现严重故障,无法开展业务,在2小时内无法解决的。预警信息用橙色表示。 特别严重预警:预警级别为一级。出现严重的系统故障,导致全省无法开展业务,并且在2小时内无法解决的(外围系统时限为1天);或结息没有结束,导致业务停顿。预警信息用红色表示。

四、应急响应

4.1网络应急响应

4.1.1蓝色预警-四级预警的应急响应。操作发现故障后,应立刻通知维护协调人,并由维护协调人通知本地区公司维护人员,由本地公司维护人员负责故障的处理和与相关线路运营商的协调。如果本地区50%以上网点出现线路故障,并且在4小时内无法修复的,升级为黄色警告。

4.1.2 黄色预警-三级预警的应急响应。维护协调人上报应急办公室,同时通知本地区维护负责人,由本地区负责人启动相关网络应急流程。应急办公室上报应急领导小组。应急办公室及时与故障地区维护单位沟通故障处理情况,并上报给应急领导小组。故障在24小时内无法解决的,升级为橙色预警。

4.1.3 橙色预警-二级预警的应急响应。机房值班人员发现故障后,立刻通知网络维护员和维护部门负责人,在半小时内到达现场,确定故障情况后,上报应急办公室,应急办公室上报应急领导小组,并向相关部门发布故障警报和预警级别。应急办公室组织技术应急,提出技术应急方案,经应急办公室上报应急领导小组批准后实施。应急办公室及时掌握故障处理进展,并及时汇报。应急领导小组在1小时内到达现场,指挥应急处理。

4.1.4 红色预警-一级预警的应急响应。机房值班人员发现故障后,立刻通知网络维护员和维护部门负责人,在半小时内到达现场,确定故障情况后,上报应急办公室,应急办公室上报应急领导小组,并向相关部门发布故障警报和预警级别。应急办公室和应急领导小组在半小时内到达现场,由应急领导小组组织应急处理,提出整体应急方案,由技术应急领导小组上报主要领导,待应急方案批准后实施。

4.2设备应急响应。

4.2.1 蓝色预警-四级预警的应急响应。机房值班人员发现故障后,立刻通知相关系统的维护技术人员,维护人员通过远程或到达现场的方式,经一步确定故障的程度,并执行一般故障处理流程。

4.2.2 黄色预警-三级预警的应急响应。机房值班人员发现故障后,立刻通知相关系统的维护技术人员,维护人员和维护主管等半小时内到达现场,执行应急处理流程,同时报告应急办公室。应急处理完成后,维护人员和维护主管监控系统运行情况,确认系统运行平稳后,方可离开现场,并上报应急办公室,应急办公室上报应急领导小组。

4.2.3 橙色预警-二级预警的应急响应。机房值班人员发现故障后,立刻通知相关系统的维护技术人员,维护人员和维护主管等半小时内到达现场,确认故障情况,报应急办公室,办公室成员1小时内到达现场,指挥应急处理,并上报应急领导小组。如果是主机故障,启动主机应急流程。其他故障,办公室协同技术应急小组,制定应急方案,上报领导小组,并及时通知相关业务部门。必要时应急领导小组到达现场指挥应急处理。

4.2.4 红色预警-一级预警的应急响应。机房值班人员立刻上报应急办公室和应急领导小组,各技术应急小组、应急办公室、领导小组成员半小时内到达现场。应急办公室通知相关业务部门,应急领导小组上报主要领导。应急领导小组组织应急方案,上报主要领导,待方案批准后,领导小组统一指挥应急处理的实施。

4.3系统应急响应

4.3.1 蓝色预警-四级预警的应急响应。相关系统的技术维护人员在发现故障后,向运维主管报告故障情况,维护主管组织技术人员登陆故障系统查找、分析故障原因,制定故障处理方案并实施。如果故障在48小时内无法解决或情况迅速恶化,升级为黄色预警。

4.3.2 黄色预警-三级预警的应急响应。相关系统的技术维护人员在发现故障后,向运维主管报告故障情况,维护主管上报应急办公室,并在1小时内到达现场,组织技术人员登陆故障系统查找、分析故障原因,制定故障处理方案并实施,处理情况报应急办公室。应急办公室及时汇总情况,并上报应急领导小组。如果故障在2小时内没有得到解决,或情况进一步恶化,则升级到橙色预警。

4.3.3 橙色预警-二级预警的应急响应。机房值机人员或相关系统的技术维护人员在发现故障后,通知运维主管,维护主管上报应急办公室。运维主管组织技术人员半小时内到达现场登陆故障系统进行故障分析、诊断。应急办公室上报应急领导小组,并发布故障预警级别,应急办公室和领导小组人员在半小时内到达现场。应急领导小组组织应急方案的制定,并上报主要领导。由应急办公室组织应急方案的实施,并及时向应急领导小组和领导汇报应急进展情况。

4.3.4 红色预警-一级预警的应急响应。发生故障后,立刻报应急办公室和应急领导小组,由应急办公室发布红色预警。相关应急小组尽快赶到现场。由应急领导小组组织应急处理。应急领导小组及时向主要领导上报应急处理情况。

五、后期处理

在应急处理完成后,应急办公室要及时组织人员做好后期现场的整理、恢复工作,及时会同相关设备、系统厂商完成设备、系统的善后处理;总结应急过程中的问题,完善应急预案和应急处理流程,并及时整理、归档。

五、宣传、培训和演练

应急办公室要定期组织相关的应急宣传和培训,不断加强安全意识。定期组织应急演练,使相关人员熟悉应急流程。加强技术培训,增强应急处理能力。

第四篇:信息系统安全应急预案

为全面加强公司信息系统安全管理,应对信息安全突发事件的发生,提高对安全事件的应急处置能力,保证网络与信息安全协调工作迅速、高效、有序地进行,满足突发情况下信息系统安全稳定、持续运行,根据总公司有关规定,制定本预案。

一、工作原则

(一)明确责任:按照“谁主管谁负责,谁运行谁负责”的要求,建立并落实统计信息系统责任制和应急机制。

(二)积极预防、及时预警:各部门应及早发现安全事件,及时进行预警和信息通报;积极做好应急处理准备,提高对安全事件的预防和应急处理能力。

(三)协作配合、确保恢复:部门间要协同配合,确保在最短的时间内完成系统的恢复。

二、应急措施

电力系统故障的应急处理流程

1.任何部门和人员发现本单位电力系统出现异常情况时,都应及时向公司办公室报告。

2.公司办公室是电力系统故障应急处理的第一责任单位。公司办公室应立即启动电力系统故障应急处理流程,尽快查清故障原因,提出解决办法,确定故障排除可能需要的时间并通知网络机房管理部门。

3.计算中心机房停电的处理

网络运行负责人应根据停电时间和UPS电池的供电能力,在保证重点网络关键设备用电的前提下,提出机房设备部分关机或全部关机方案,经认可后按照规定的流程操作实施。

4. 电力系统恢复供电后的处理流程

电力系统恢复供电后,公司办公室应在第一时间通知技术部门,以便以最快的速度恢复关闭的网络应用。系统管理人员在接到通知后,按照规定的流程开启关闭相关设备。

(二)消防系统应急处理流程

1.报告和简单处理

当出现火情、火灾时,发现人员应在最短时间内报告公司办公室及机房管理部门。若火情严重时,应迅速拨打119电话报警,并尽可能采取一些简单可行的方法作初步处理,如:使用周围的灭火器、水源(在允许用水灭火的场合)或采用其他灭火措施、手段。进展情况随时向有关领导报告。

2.灭火

计算中心机房出现火情并且无法进行局部处理时,机房管理人员在紧急报告有关领导的同时,应立即疏散物理场地楼层以内的工作人员。

三、网络信息系统故障的应急处理流程

1.报告和简单处理

网络设备、网络应用系统故障应由发现人通知机房管理人员,技术部门立即检查故障,进行初步故障定位。如果网络、应用系统出现比较严重的问题,对网络业务的正常运行造成较大的影响,需立即向有关领导报告。 2.故障判断与排除

对简单故障,运维人员应迅速排除故障,解决问题并记录。如果需要更换设备,应上报有关领导,经批准后马上更换故障设备,尽快恢复网络、应用系统运行。运维人员判断无法及时修理时,应立即通知相关的系统运行服务提供商,在最短的时间内安排修理或更换系统。

3.网络线路故障排除

如发现属外部线路的问题,应与线路服务提供商联系,敦促对方尽快恢复故障线路。

4.启用备份线路、设备、系统(如果存在的话),迅速恢复相关的应用。

四、网站检测与自动恢复系统应急处理流程

1.报告和简单处理

发现公司服务网站等对外不能正常打开或网站内容被恶意篡改时,任何公司人员都有义务向技术部门报告。由技术部们组织应急响应并进行故障排查。 2.处理和恢复使用

先查看网络连接情况,若不是网络故障,再排查软、硬件故障。待故障处理完成并经过测试后,恢复系统的正常运行和内容的正常应用。

五、黑客入侵的应急处理

1.报告和简单处理

发现网络上有黑客攻击行为,任何人员都有义务向技术部门报告。技术部门立即启动应急响应,切断受攻击计算机与网络的连接,停止一切操作、保护现场,并上报有关领导。 2.处理和恢复使用

对于黑客攻击,由技术部门与机房管理人员协同查找入侵踪迹,分析入侵方式和原因,分析入侵事件并内部网计算机进行整改,防止黑客用同样的手段再次入侵其他系统。检查确定无安全隐患后,才可将受攻击计算机重新连接网络,或启用备份计算机来恢复应用。 3.应急响应

机房管理人员应做好记录,保护现场,进行日志收集等工作。如果能追查到攻击者的相关信息,可以对其发出警告,必要时可以采取进一步的行动,乃至采取法律手段。根据破坏程度,经有关领导同意后,上报公安部门。 若系统已被黑客破坏,无法恢复,应将受黑客攻击的服务器上的重要数据备份到其他存储介质,并做好数据异地备份工作,确保服务器内重要的数据不丢失。

六、大规模病毒(含恶意软件)攻击的应急处理

1.报告和简单处理

发现网络上有大规模病毒攻击的行为,任何人员都有义务向技术部门报告。由机房管理员组织应急响应,切断受攻击计算机与网络的连接,停止一切操作、保护现场,立即上报有关领导。 2.已知病毒的处理和恢复

使用最新版本杀毒软件对染毒计算机进行全面杀毒,并对染毒计算机系统进行漏洞修补。机房管理员确定没有病毒和安全漏洞后,再连接网络恢复使用。 3.未知病毒的处理和恢复

观察网管软件根据监视窗口的链路状态,由此判断感染病毒或恶意程序的客户端、服务器所属的楼层交换机。打开该交换机的端口流量分析窗口,根据流量判断感染病毒或恶意程序的客户端所科交换机端口。关闭该交换机端口,隔离该工作站、服务器,阻断与局域网的连接。根据端口状态功能,查看该感染病毒或恶意程序的工作站的IP地址。根据IP地址信息找到该工作站的具体位置,对该工作站进行病毒或恶意程序清除工作。根据对于未知病毒,应首先尝试手工杀毒处理,若系统已被病毒破坏,无法恢复,应将感染病毒的计算机上的硬盘加挂到其他机器上处理,将重要数据备份到其他存储介质,尽最大努力保护、保留感染计算机内重要的数据,同时防止病毒感染其他计算机。

七、预案的发布与生效

本预案自发布之日起生效

第五篇:信息系统安全应急预案

xxx信息系统安全应急预案v1.0 1 目的

随着大量信息技术的采用,公司信息化建设发展迅速,并日益成为提高公司竞争力的重要因素。公司建立了支持全公司业务经营的核心业务处理系统、财务处理系统、OA系统和邮件系统,实现了数据的集中管理。但伴随着公司信息化建设的发展,IT系统的安全性也越发重要,需要全面加强信息安全性的建设,确保系统不受到来自内部和外部的攻击,实现对非法入侵的安全审计与跟踪,保证业务应用和数据的安全性。同时还必须建立起一套完善、可行的应急处理规章制度,在出现重大情况后能及时响应,尽最大可能减少损失。

1. 2 公司系统架构和现状

2.1 IT应用系统架构

公司的IT系统以总公司为中心,各分支机构通过租用专用线路同总公司连通,在各分支机构内部也建立较完善的多级综合网络,包括中心支公司、支公司、出单点等等。在网络上运行着以下系统:

(一)生产系统

包括核心业务处理系统、财务处理系统、再保险处理系统等,贯穿公司的各个层面,包括总公司、分公司、支公司、出单点等,是公司整个IT系统的核心部件,也是最需要投入资源的部分。

(二)办公自动化系统

辅助公司日常办公的系统,实现公司上下级之间的公文与协同工作信息传递。

(三)邮件系统 为公司内、外部信息交流提供方便、快捷的通道。

(四)公司网站

发布公司信息,在宣传公司,提升公司形象上发挥重要作用。

2.2 系统安全隐患

由于公司的系统是多应用、多连接的平台,本身就可能存在着难于觉察的安全隐患,同时又面临来自各方面的安全威胁,这些威胁既可能是恶意的攻击,又可能是某些员工无心的过失。下面从网络系统、操作系统与数据库、数据以及管理等方面进行描述:

(一)网络

与公司各级网络进行互联的外部网络用户及Internet黑客对各级单位网络的非法入侵和攻击;公司内部各级单位网络相互之间的安全威胁,例如某个分支单位网络中的人员对网络中关键服务器的非法入侵和破坏;在各级单位网络中,对于关键的生产业务应用和办公应用系统而言,可能会受到局域网上一些无关用户的非法访问。

(二)操作系统与数据库

操作系统与数据库都存在一定的安全缺陷或者后门,很容易被攻击者用来进行非法的操作;系统管理员经验不足或者工作疏忽造成的安全漏洞,也很容易被攻击者利用;系统合法用户特别是拥有完全操作权限的特权用户的误操作可能导致系统瘫痪、数据丢失等情况。

(三)网络应用

网络上多数应用系统采用客户/服务器体系或衍生的方式运行,对应用系统访问者的控制手段是否严密将直接影响到应用自身的安全性;由于实现了Internet接入,各级单位的计算机系统遭受病毒感染的机会也更大,且很容易通过文件共享、电子邮件等网络应用迅速蔓延到整个公司网络中;网络用户自行指定IP地址而产生IP地址冲突,将导致业务系统的UNIX小型机服务器自动宕机。

(四)数据

数据存储和传输所依赖的软、硬件环境遭到破坏,或者操作系统用户的误操

作,以及数据库用户在处理数据时的误操作,都会使严重威胁数据的安全。

(五)管理

如果缺乏严格的企业安全管理,信息系统所受到的安全威胁即使是各种安全技术手段也无法抵抗。

在充分认识到确保核心业务和应用有效运转的前提下,公司已经采取了一定的措施,如利用操作系统和应用系统自身的功能进行用户访问控制,建立容错和备份机制,采用数据加密等。但是这些措施所能提供的安全功能和安全保护范围都非常有限,为了在不断发展变化着的网络计算环境中保护公司信息系统的安全,特制定了IT系统重大事件应急方案。

2. 3 IT系统重大事件的界定

IT系统的脆弱性体现在很多方面,小到短暂的电力不足或磁盘错误,大到设备的毁坏或火灾等等。很多系统弱点可以在组织风险管理控制过程中通过技术的、管理的或操作的方法消除,但理论上是不可能完全消除所有的风险。为了能更好的制定针对IT系统重大事件的应急方案,必须先对所有可能发生的重大事件进行详细的描述和定义。下面将从IT系统相关联的电源、网络、主机及存储设备、数据库、病毒、信息中心机房等多个方面进行说明。

3.1 电源

电源是IT系统最基础的部分,也是最容易受到外界干扰的部分之一。在既能保证公司系统平稳运行,又能保证关键或重要设备安全的前提下,根据目前配备的UPS电源的实际情况,将电源事件分为三个层次:

一般性电源事件:停电时间在1小时以内的(包括1小时); 需关注电源事件:停电时间在2小时以内的(包括2小时); 密切关注电源事件:停电时间在2小时以上的。

3.2 网络

网络是IT系统及网络客户进行通讯的通道,也是最容易受到外界干扰或攻击的部分之一。目前总公司主要对各地分公司到总公司的网络线路进行管控,而公司又是采用数据集中的运营模式,鉴于这种情况,将网络事件分为三个层次:

一般性网络事件:楼层交换机出现异常,或局域网络中断时间在5分钟以内的(包括5分钟);

需关注网络事件:主交换机、防火墙、上网设备出现异常,或局域网络中断时间在30分钟以内的(包括30分钟),广域网络中断时间在5分钟以内的(包括5分钟);

密切关注网络事件:主干交换机、核心路由器、VPN设备出现异常,或广域网络中断时间在30分钟以上的。

3.3 主机及存储设备

主机及存储设备是IT系统运行的关键和核心,也是相对脆弱的部分,对工作环境的要求是相当高的,任何外部的变化都可能导致这些设备出现异常。根据出现的异常情况,将主机及存储设备事件分成三个层次:

一般性事件:非系统关键进程或文件系统出现异常,不影响生产系统运行的; 需关注事件:根文件系统或生产系统所在的文件系统的磁盘空间将满/已满或系统关键进程异常,即将影响或已经影响生产系统运行的;主机或存储设备的磁盘异常并发出警告的;

密切关注事件:主机宕机;存储设备不能正常工作的;主机与存储设备中断连接的;主机性能严重降低,影响终端用户运行的;系统用户误操作导致重要文件丢失的。 3.4 数据库

数据库是存储公司经营信息的关键部分,由于数据库是建立在主机及存储设备上的应用,任何主机及存储设备的变化都会对数据库产生或大或小的影响,同时数据库也是公司各个层面用户的使用对象,用户对数据的操作可能导致不可预料的影响。根据数据库对外界操作的反映,将数据库事件分为两个层次:

一般事件:不影响大量用户或应用系统正常运行的警告或错误报告; 重要事件:数据库的系统表空间将满/已满的;业务系统表空间将满/已满的;数据库网络监视进程终止运行的;数据库内部数据组织出现异常的;数据库用户误操作导致数据丢失的;数据库关键进程异常;数据库性能严重降低,影响终端用户运行;数据库宕机。

3.5 电脑病毒

由于Internet接入,员工从Internet上进行下载或者接收邮件,都有感染病毒的可能性。某些病毒带有极大的危害性和极快的传播速度,从而可能导致在公司内部的病毒大范围传播。针对病毒在公司内部的传播范围或危害程度,分为三个层次:

一般性事件:独立的病毒感染,并没有传播和造成损失的;

密切关注事件:病毒小范围传播,并造成一定损失,但不是重大损失的; 严重关注事件:病毒大范围传播,并造成重大损失的;

3.6 其他事件

信息中心机房其他影响IT系统运行的因素可能会产生一些突然事件,主要有以下一些方面:

(一)空调工作异常,导致机房温度过高;

(二)空调防水保护出现异常导致渗水;

(三)发生火灾;

(四)粉尘导致主机或存储设备异常的。

3. 4 信息系统重大事件的应急方案

根据上节对IT系统重大事件的界定,公司已经建立了一套完整的应急方案,在硬件方面采用双机热备机制,同时加强日常的系统监控,保持完整的数据备份,及时进行灾难恢复,和储备必要的系统备件等多种技术和方法。下面按照IT系统相关联的电源、网络、主机及存储设备、数据库、电脑病毒等多个方面进行说明。

4.1 电源

采用UPS为主要设备进行供电,为了应对重大突发事件,采用以下了手段:

(一)加强UPS的维护,保证UPS的正常工作;

(二)在必要情况下,交流输入供电系统采用双路市电供电和发电机联合供电,保证市电使长期停电, UPS仍能正常供电;

(三)直流输入方面,采用公用一组电池组的设计,配置长达4小时的后备电池, 并提供交流输入瞬变或市电与发电机供电切换时的短时供电;

(四)根据停电时间的长短,依次发布一般性通知、较紧急通知和紧急通知给相关部门和机构;

(五)停电发生后,及时联系供电部门和物业管理部门。

4.2 网络

(一)核心路由器做双以太口绑定,如一端口发生故障,自动切换到VPN备份线路接入主机系统,直到修复使用正常,同时由网络集成商提供技术和备件支持,一旦出现紧急故障,1小时赶到现场处理故障;

(二)到分支机构专线采用2M数字线路,如2M数字线路发生故障断开则自动切换到VPN备份线路接入主机系统,直到专线修复则使用正常2M线路通信;

(三)对于网络核心设备出现重大故障,尽快了解情况,分析问题和提出应急解决方案,做好现场应急处理,立即通知网络集成服务商到现场处理,主干交换机由网络集成商提供技术和备件支持,一旦出现紧急故障,1小时内赶到现场处理故障;

(四)为防止核心路由器或主干交换机发生故障后无法解决问题,在必要情况下,配备一台备用路由器和主干交换机,配置接口与核心路由器和主干交换机相同,一旦出现故障,能在十分种内进行更换;

(五)采用CISCO PIX FIREWALL在网络入口处检查网络通讯,根据设定的安全规则,在保护内部网络安全的前提下,保障内外网络通讯,实现了内部网络与外部网络有效的隔离,所有来自外部网络的访问请求都要通过防火墙的检查,内部网络的安全将会得到保证。具体有:

1、设置源地址过滤,拒绝外部非法IP地址,有效避免了外部网络上与业务无关的主机的越权访问;

2、防火墙只保留有用的WEB服务和邮件服务,将其它不需要的服务关闭(含即时通信QQ或其它,MSN控制在一定范围使用),将系统受攻击的可能性降低到最小限度,使黑客无机可乘;

3、防火墙制定访问策略,只有被授权的外部主机可以访问内部网络的有限IP地址,保证外部网络只能访问内部网络中的必要资源,与业务无关的操作将被拒绝;

4、全面监视外部网络对内部网络的访问活动,并进行详细的记录,及时分析得出可疑的攻击行为;

5、网络的安全策略由防火墙集中管理,使黑客无法通过更改某一台主机的安全策略来达到控制其他资源访问权限的目的;

6、设置地址转换功能,使外部网络用户不能看到内部网络的结构,使黑客攻击失去目标。 4.3 主机、存储设备及数据库

为保证生产系统稳定运行,主机与存储系统保持7X24小时的可用。为应对可能发生的重大事件或突发事件,采取以下措施:

(一)在接到紧急停电通知后30-40分钟内按照先数据库、次主机、最后存储设备的顺序停止所有系统运行,在必要的情况下,须拔掉所有电源插头;

(二)采用双机热备技术,在其中一台主机出现异常时,及时进行切换;

(三)采用硬盘、磁带库等设备作好日常数据备份;

(四)如果发生误删除操作系统文件,立即进行文件系统恢复(必须有备份);

(五)如果发生误删除数据,立即进行数据库恢复(必须有备份);

(六)如果文件系统空间不够,导致系统不能正常运行,立即进行文件系统扩展。

(七)如果数据库表空间不足,立即进行表空间扩展,同时可能还进行文件系统扩展;

(八)在必要情况下,建立异地数据备份中心,以保持数据安全性。

(九)出现重大故障,尽快了解情况,分析问题和提出应急解决方案,做好现场应急处理,立即通知系统服务商到现场处理,并由系统服务商提供备件支援。

4.4 电脑病毒

为防止电脑病毒在公司内部的传播,反毒和信息安全应按照“整体防御,整体解决”的原则实施,采用多种手段和产品来切断电脑病毒的传播“通道”。具体措施如下:

(一)配置企业级网络版杀毒软件,在公司总部、分公司、营业部所有联网的PC机、PC服务器上安装病毒/邮件防火墙,部署统一的公司网络防毒系统,实现反毒分级防范和集中安全管理;

(二)在公司总部和分公司配置防毒网关服务器,检查所有进出邮件、所访问的网页和FTP文件,防止病毒通过外部网络进入公司内网进行传播;

(三)建立定时自动更新防病毒软件和病毒库的机制,确保杀毒软件的有效性;

(四)建立集中的网络入侵检测和漏洞扫描系统,防范黑客入侵和攻击,及时给系统打补丁;

(五)加强对用户的教育,不从不明网站下载,不查看来源不明的邮件,不运行可能含有病毒的程序等;

(六)如果用户机器发现病毒,应立即终止网络连接并通知信息部门进行相关处理;

(七)如果因病毒发作而导致数据丢失,应立即与信息部门联系,不要自行处理。

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:英语社会调查报告下一篇:医院外科工作总结