数据管理平台项目应急保障方案.docx
数据管理平台项目应急保障方案
目录
TOC\h\z\u1.1.1应急指导思想 1
1.1.2应急处置原则 1
1.1.3应急处理机制 3
1.1.4应急处理流程 3
1.1.5应急处理措施 4
1.1.5.1可能存在的紧急情况 4
1.1.5.2对于网络故障应急预案 4
1.1.5.3应用系统故障应急预案 5
1.1.5.4对于人为因素所造成的故障 6
1.1.5.5对于系统调整所造成的紧急情况 6
1.1.5.6黑客攻击事件应急预案 6
1.1.5.7网络攻击事件应急预案 7
1.1.5.8数据破坏事件应急预案 7
1.1.5.9数据内容安全事件应急预案 8
1.1.5.10重大事故报警制度 8
应急指导思想
全面防范、快速反应、确保安全、妥善处理、准确汇报。
应急处置原则
该项目主要采取的应急处理原则如下:
1.统一领导
在公司应急领导小组的统一指挥下,按照管理权限赋予相应处置职责,实行分级管理和分级处置,遇到重大数据系统异常情况,应及时向有关领导报告,以便于统一调度、减少损失。
2.综合协调
明确综合协调的职能机构和人员,做到职能间的相互衔接。
3.重点突出
应急处理的重点放在运行着重要业务系统或可能导致严重事故后果的关键数据系统上。
4.及时反应,积极应对
出现数据系统故障时,数据系统维护人员应及时发现、及时报告、及时抢修、及时控制,积极对数据系统突发事件进行防范、监测、预警、报告、响应。
5.快速恢复
系统管理人员在坚持快速恢复系统的原则下,根据职责分工,加强团结协作,必要情况下与平台供应商以及系统集成商共同谋求问题的快速解决。
6.防范为主,加强监控
经常性地做好应对数据系统突发事件的思想准备、预案准备、机制准备和工作准备,提高系统的综合保障水平。加强对数据系统应用的日常监视,及时发现数据系统突发性事件并采取有效措施,迅速控制事件影响范围,力争将损失降到最低程度。
应急处理机制
1、数据管理平台应用部门发现系统出现故障,应及时立即通知部门责人,部门负责人理应立即通知应急小组,并即刻通报领导小组决定部份或全部启动应急预案。
2、应急小组应在24小时之内初步查明故障原因、所需恢复时间,并通知相关部门负责人,必要时及时向领导小组报告。
3、应急小组在事后将详细的故障原因及处理结果报告领导小组。
应急处理流程
应急处理措施
我司将在项目验收前制订《故障应急处置预案》,帮助客户解决突发问题。该《故障应急处置预案》在投入使用前,我司将和甲方认真讨论和修改,在甲方批准的情况下才能投入使用。
可能存在的紧急情况
硬件故障:如服务器硬件故障,网络故障,磁盘阵列故障,电源故障等。
软件故障:如操作系统性能急剧下降或死机,数据库、中间件、备份软件或其他关键应用发生问题等。
人为因素:因管理不完善或工作人员操作不当带来的各种影响。
系统调整:如网络调整、相关系统上线、应用变更、平台升级、割接等。
黑客攻击事件应急预案
网络攻击事件应急预案
数据破坏事件应急预案
数据内容安全事件应急预案
重大事故报警制度
对于网络故障应急预案
当客户系统的发生网络故障时,可应用切换备用网络系统上,将客户的损失减到最低,同时将启动网络故障应急预案。下面将是具体的实施步骤:
确认是否网络出现问题,排除主机、存储和应用故障。
将应用切换备用网络系统上。
联系网络系统的开发或维护商对现场应用进行诊断。
根据诊断结果修复相关的问题。
将应用切回到主用网络系统上。
重新在群集环境中对应用进行测试。
填写现场技术服务报告记录。
整理事故报告并备案。
应用系统故障应急预案
当客户的应用发生故障时,可启用备用系统,将客户的损失减到最低,同时将启动应用故障应急预案。下面将是具体的实施步骤:
确认是否应用系统存在问题,排除网络、主机和存储故障。
将应用切换到备用系统上。
联系应用系统的开发或维护商对现场应用进行诊断。
根据诊断结果修复相关的问题。
重新在群集环境中对应用进行测试。
填写现场技术服务报告记录。
整理事故报告并备案。
对于人为因素所造成的故障
加强对相关人员的专项培训
建立完善的维护操作规范
总结经验,及时推广
对于系统调整所造成的紧急情况
事先提供完善的计划和安排,考虑全面的回退措施
重点任务的实施要经相关配合人员的充分讨论,并明确分工
专家审核变更、上线、调整的方案,保证可靠和高成功率
需要的时候现场驻守工程师保证顺利实施
黑客攻击事件应急预案
当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告数据网络事件应急小组