文档详情

产品经理标准化数据备份及恢复操作手册.pdf

发布:2024-10-06约1.22万字共14页下载文档
文本预览下载声明

产品经理标准化数据备份及恢复操作手册

1目标

产品经理必须具备软件系统数据备份及系统恢复的操作能力,保障软件产品

安全稳定运行,客户使用公司软件产品时能够安全、有序、健康、高效地开展工

作,预防紧急突发事件、及时排查和迅速处理故障。

2要求及约束

为了实现以上目标,需要各种内、外部环境和设施:

需要所有相关人员统一思想、统一认识,积极主动参与系统的建设和维护中

来。形成严格的问题反馈机制。

形成高效的应急领导小组,项目经理责任制,组长把关,职责到人明确分工,

在工作中管理得当、到位。实施人员工作认真、负责,规范化、流程化工作,如

有标准操作手册一定要严格执行。遵守现场规定的各种系统集成、系统维护、数

据库维护工作规范等。

建立高效的协调机制,由于该系统会集成其他厂家系统或数据中心数据,相

关接口要求明确、沟通流畅,预防通道阻塞。其他如数据库、中间件、系统配置

相关软件厂家和供应商要有交流渠道,一旦发现问题立即解决。

需要提供良好的办公环境,为集中解决问题提供便利。

需要定期召开协调会议,通报系统建设情况和存在问题。

3组织机构与职责

产品经理牵头组织成立的运行应急处理组织机构一般应包括日常维护监控

组、应急指挥中心、应急工作组,应急工作组包括程序故障应急小组、应用故障

应急小组、平台故障应急小组、网络故障应急小组、后勤保障应急小组。

3.1应急指挥中心

应急指挥中心由应急组长、项目经理、项目管控领导等构成。

公司应急指挥中心的主要职责:

(1)审定软件系统优化提升时系统的运行应急预案;

(2)宣布进入和解除应急状态,决定实施和终止软件优化提升上线、上线运

行应急预案;

(3)对系统突发事件级别进行决策,并统一指挥应急处置工作;

(4)研究讨论突发事件的产生原因、处理过程、处理结果,并公布处理办法

进行确认归档。

3.2应急工作组

应急工作组按职能角色分类,应该由软件开发负责人、软件工程师,网络工

程师,实施工程师,系统集成工程师,测试工程师等构成。

应急工作小组在系统应急突发事件中的主要职责:

(1)落实应急指挥中心部署的各项任务;

(2)负责公司软件应急预案的编制工作;

(3)监督执行应急指挥中心下达的应急指令、重大应急决策和部署,协调各

方应急资源,组织各单位及故障处理小组进行应急处理;

(4)及时了解和掌握系统突发事件与应急处置工作情况,向应急指挥中心报

告应急处置过程中发现的重大问题,并协调解决;

(5)负责系统突发事件调查、总结应急处理经验和教训等后期处置工作。

(6)人员分工详见《应急组织及人员分工表》。

4事件分级

软件故障对服务的用户和公司生产、经营和管理的影响范围、程度、可能产

生的后果和损失等因素,将系统故障分为重大事件(I级)、较大事件(II级)和

一般事件(III级)三个等级。

发生一般事件(III级)公司及时要求进入系统应用III级应急状态,发生

II级突发事件公司进入II级应急状态,发生I级系统突发事件公司进入I级应

急状态。

4.1重大事件

重大事件是指上线运行过程中,整个系统或功能模块无法运行,且持续6个

小时无法恢复,严重损害客户的利益的突发事件;或者系统运行过程中的关键业

务出现严重错误,对公司正常运营和监测造成严重影响和巨大经济损失的突发事

件;或者网络故障造成大面积用户服务中断的突发事件。

软件出现重大事件主要有:

➢应用系统宕机,造成系统无法使用和正常运转。

➢在IMS监控中出现数据断连情况,影响数据正常传递。

➢数据库中数据丢失,给客户带来重大损失、影响正常监测。

4.2较大事件

较大事件是指割接过程中或上线运行过程中,整个系统或功能模块可以运行,

但是性能大幅下降,且持续6个小时无法恢复,一定程度上损害客户利益的突发

事件;或者系统运行过程中的关键业务出现较大错误,对运营监测造成较大影响

和较大经济损失的突发事件;或者网络故障造成部分用户服务中断的突发事件。

软件出现较大事件主要有:

➢流程无法上传下达。

➢无法监控项目信息异动。

4.3一般事件

一般事件是指割接过程中或上线运行过程中,整个系统或功能模块运行正常,

关键业务运行正常,但是性能有一定程度的下降;或者

显示全部
相似文档