Oracle数据库巡检方案.doc
文本预览下载声明
{Oracle数据库管理规范}
Page PAGE 4 of NUMPAGES 4
Oracle数据库巡检维护方案
一、巡检维护的目的
为了保障数据库正常运行,保证数据的安全性、完整性和可用性,需进行数据库巡检维护。
二、巡检维护的分类
数据库巡检维护包含的内容很多,如果每天都将这些项目进行一遍,在时间上是不允许的,可能还会影响到数据库使用效率,因此,通常会将这些巡检维护内容分门别类地按不同的时间频率进行。
数据库巡检维护按时间频率可分为日巡检、周巡检、月巡检、半年度巡检四类。
日巡检维护指每日按计划进行的巡检维护活动,以检查数据库运行状态、数据库备份状态和告警错误为主要内容,同时还必须检查使用数据库的应用软件是否因数据库运行原因产生使用错误或不畅。
周巡检维护指按一周为周期,在每周指定日按计划进行的巡检维护活动,它的工作内容是在日巡检维护工作内容的基础上添加数据库对象检查、安全性检查等内容组成。
月巡检维护指按一月为周期,在每月指定日按计划进行的巡检维护活动,它的工作内容是在周巡检维护工作内容的基础上添加系统参数配置检查、硬件与系统平台运行状态检查等内容组成。
半年度巡检维护指按半年为周期,在指定日按计划进行的巡检维护活动,它的工作内容是在月巡检维护工作内容的基础上添加数据库性能诊断检查组成。
如果能够提供模拟环境或生产环境在特定条件下允许停机,还应该进行备份有效性测试。
由于巡检维护工作任务的涵盖性,进行半年度巡检维护日可不执行所在月的月巡检维护、所在周的周巡检维护和日巡检维护,以此类推。
三、巡检维护工作内容和周期
1、环境与系统相关
序号
内容
命令
关注点
使用频率
1.1
文件系统使用率
HP系统命令 bdf
查看文件系统使用率
使用率80%以下
日巡检
1.2
服务器网络情况
HP系统命令 netstat
检测网络连接情况
lsnrctl status 实例名
检测Oracle监听程序运行状态
手工打开sqlnet.ora、
tnsname.ora、listener.ora查看设置是否变动。
网络连接可用,数据库联接正常
月巡检
1.3
服务器CPU及I/O等待情况
HP系统命令:
sar -u 采样频率(秒) 采样次数
检查CPU使用情况
%wio: CPU等待输入输出完成时间的百分比。值过高,表示硬盘在I/O 瓶颈。
%idle: CPU空闲时间百分比。值如果持续低于 10,那么系统的CPU 处理能力相对较低。
月巡检
1.4
服务器内存情况
HP系统命令
vmstat 采样频率(秒) 采样次数
检查内存及CPU使用情况
procs:r:在运行队列中等待的进程数
b:在等待io 的进程数
w:可以进入运行队列但被替换的进程。
memoy:内存使用情况(k表示)
disk:显示每秒的磁盘操作
faults:显示每秒的中断数
cpu:表示cpu的使用状态
月巡检
1.5
服务器内存使用情况
HP系统命令 swapinfo
内存使用情况
used:已使用的内存(k表示)
free:未使用的内存(k表示)
ptc used:使用百分比
月巡检
1.6
服务器I/O情况
HP系统命令 iostat -t
检查磁盘繁忙程度
bps:哪些磁盘比较忙
Sps:哪些磁盘比较闲
月巡检
二、数据库相关
2.1
检查实例状态
HP系统命令:ps -ef |grep Oracle
筛选关键字为“Oracle”的进程查看进程运行状态。
Oracle命令:
select * from v$instance
查询动态视图v$instance,查看正运行的实例及运行状态。
使用OEM界面连接实例并判断连接是否正常。在OEM界面中选择所检查的实例,右键单击选择连接,输入“用户名:密码”,看能否正常连接实例。
实例运行正常,数据库可用
日巡检
2.2
检查第三方备份软件当日数据库备份是否正常执行
日巡检
2.3
检查当前会话数与进程数
查询Oracle动态视图v$session;
v$lock可查看会话和锁
查看OEM界面:“例程-会话/锁”能查看会话和锁
进程数怎么看V$Process
1、会话数和用户锁数量在合理范围内
2、没有死锁
日巡检
2.4
检查数据文件、控制文件、日志文件、归档日志
查询Oracle动态视图v$datafile;v$logfile; v$log;v$controlfile; v$archived_log可分别获得数据文件、日志文件、控制文件、归档日志的相关信息。
查询Oracle系统表dba_data_files;dba_temp_files可获得数据文件相关信息。
查看OEM界面:“存储-控制文件/数据文件/重做日志组/归档日志”也能够获得相关信息。
状态是否正常,
显示全部