38.Linux 监控服务之nagios.pdf
文本预览下载声明
Nagios
Nagios (nai ge si)原名为NetSaint,由Ethan Galstad 开发并维护至今。NAGIOS 是一个缩写
形式: Nagios Aint Gonna Insist On Sainthood Sainthood 翻译为圣徒,而Agios是saint的希
腊表示方法。
Nagios 是一款开源的免费网络监视工具,能有效监控Windows、Linux 和 Unix 的主机状态,
交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时
间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
Nagios 不但能够实现对系统CPU,磁盘、网络等方面参数的基本系统监测,而且还能够监测
包括SMTP,POP3,HTTP,NNTP 等各种基本的服务类型。另外通过一些插件的安装和监测
脚本自定义用户可以针对自己的应用程序实现监测,并针对大量的监测主机和多个对象部署
层次化的监测架构。而且在监测信息统计方面,Nagios 也能够和例如Cacti 等程序结合来提
供动态统计图表。除此之外 Nagios 拥有强大的日志管理系统,可以实现详细的日志记录以
及回卷。针对架构的扩展和服务器数量的增加可以方便地实现监测区域扩展。最难能可贵的
是 Nagios 提供了优秀的事件报警功能,能够将一些突发的事件以电子邮件的形式通知管理
员并能够针对出现的问题提供一些主动的解决建议和方案,并支持冗余监视。
一、Nagios 概述
1、简介
Nagios 是插件式的结构,它本身没有任何监控功能,所有的监控都是通过插件进行的,因此
其是高度模块化和富于弹性的。Nagios 监控的对象可分为两类:主机和服务。主机通常指
的是物理主机,如服务器、路由器、工作站和打印机等,这里的主机也可以是虚拟设备,如
xen 虚拟出的Linux 系统;而服务通常指某个特定的功能,如提供http 服务的httpd 进程等。
而为了管理上的方便,主机和服务还可以分别被规划为主机组和服务组等。
Nagios 不监控任何具体数值指标(如操作系统上的进程个数),它仅用四种抽象属性对被监控
对象的状态进行描述:OK、WARNING, CRITICAL 和UNKNOWN。于是,管理员只需要对某种
被监控对象的 WARNING 和 CRITICAL 状态的阈值进行关注和定义即可。Nagios 通过将
WARTING 和 CRTICAL 的阈值传递给插件,并由插件负责某具体对象的监控及结果分析,其
输出信息为状态信息(OK,WARNING,CRITICAL 或UNKOWN)以及一些附加的详细说明信息。
Nagios 可以识别4 种状态返回信息,即 0(OK)表示状态正常/绿色、1(WARNING)表示出现警
告/黄色、2(CRITICAL)表示出现非常严重的错误/红色、3(UNKNOWN)表示未知错误/深黄色。
Nagios 就是分析结果,返回4 中状态的某一种,并能实现报警机制,来给管理员发送报警通
知。
2、特性
由上述说明可以,Nagios 是极富弹性的,其监控功能完全可以按照管理员的期望进行。此外,
它外提供了对问题的自动响应能力和一个功能强大的通知系统。所有这些功能的实现是基于
一个结构明晰的对象定义系统和少数几个对象类型实现的。
1) 命令(Commands)
“命令”用于定义Nagios 如何执行某特定的监控工作。它是基于某特定的Nagios 插件定义
出的一个抽象层,通常包含一组要执行的操作。
2)时段(Time periods)
“时段”用于定义某“操作”可以执行或不能执行的日期和时间跨度,如工作日内的每天
8:00-18:00 等;
3)联系人和联系人组(Contacts and contact groups)
“联系人”用于定义某监控事件的通知对象、要通知的信息以及这些接收通知者何时及如何
接收通知;一个或多个联系人可以定义为联系人组,而一个联系人也可以属于多个组;
4) 主机和主机组(host and host groups)
“主机”通常指某物理主机,其包括此主机相关的通知信息的接收者(即联系人)、如何及何
时进行监控的定义。主机也可以分组,即主机组(host groups),一个主机可同时属于多个组;
5) 服务(Services)
“服务”通常指某主机上可被监控的特定的功能或资源,其包括此服务相关的通知信息的接
收者、如何及何时进行监控等。服务也可以分组,即服务组(Service groups),一个服务可同
时属于多个服务组;
3、Na
显示全部