AIX系统的ERRPT命令配置详细解释.docx
文本预览下载声明
Errpt命令详解以及在网管下面如何配置ERRPT命令专门用在IBM服务器自带的系统AIX下面的监控服务器硬件损坏的错误日志查看命令。一旦系统的某个功能模块检测到一个错误或定义的需要记录日志的事件,则记录到/dev/error设备,把它保存在NVRAM中,这样可以保证即使在系统崩溃的情况下也不会丢失最新的错误日志。同时,错误日志进程errdemon从/dev/error文件中读取错误日志,然后根据错误模版库(/var/adm/ras/errtmpit)和错误消息库(/usr/lib/nls/msg/$LANGcodepoint.cat)对其进行处理后写入系统的错误日志/var/adm/ras/errlog中。 错误日志进程由/usr/lib/errdemon命令启动,/usr/lib/errstop停止,默认是启动的。最可能用到的可能就是-l参数了 /usr/lib/errdemon –l # /usr/lib/errdemon -l Error Log Attributes -------------------------------------------- Log File /var/adm/ras/errlog Log Size 1048576 bytes Memory Buffer Size 16384 bytes Duplicate Removal true Duplicate Interval 100 milliseconds Duplicate Error Maximum 1000 上面显示我的错误日志文件是/var/adm/ras/errlog,这也是系统默认的错误日志的存放位置。 查看错误日志:errpt命令 用more或者其他文本的查看命令来打开errlog文件我们看到的只是一对乱码,为了能够查看错误日志文件需要使用aix的errpt命令。 # errpt IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION 9DBCFDEE 0109034400 T O errdemon ERROR LOGGING TURNED ON 192AC071 0109034300T O errdemon ERROR LOGGING TURNED OFF C092AFE4 0109033500I Octcasdctcasd Daemon Started A6DF45AA 0109033500I O RMCdaemon The daemon is started. 9DBCFDEE 0109033400T O errdemon ERROR LOGGING TURNED ON这里的输出分为六列依次为: 1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。 2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。 3.类型TYPE:错误的类型,或者说严重的程度。 分为6个: PEND 设备或功能组件可能丢失简写P PERF 性能严重下降 P PERM 硬件设备或软件模块损坏,确诊了的 P TEMP 临时性错误,经过重试后已经恢复正常 T INFO 一般消息,不是错误 I UNKN 不能确定错误的严重性 U 4.种类CLASS c:指出错误源 H 硬件或介质故障 S 软件故障 O 人为错误 U 不能确定 5.资源名RESOURCE_NAME 最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。 6.描述显示具体的日志信息(这是我们在网管中会用到的东西,将会通过他来进行告警) # errpt -a|more --------------------------------------------------------------------------- LABEL: ERRLOG_ON IDENTIFIER: 9DBCFDEE Date/Time: Sun Jan 9 03:44:04 BEIS Sequence Number: 309 Machine Id: 004250B94C00 Node Id: ibm-5L Class: O Type: TEMP Resource Name: errdemon Description ERROR LOGGING TURNED ON Probable Causes ERRDEMON STARTED AUTOMATICALLY User Causes /USR/LIB/ERRDEMON COMMAND Re
显示全部