HACMP备忘单使用AIX构建冗余环境,获取高可用性.docx
文本预览下载声明
有些类型的计算环境不能承受停机的代价 — 其中的应用程序和数据非常重要,如果一台机器停机,您希望另一台机器能够立即接管其工作。幸运的是,在 IBM? AIX? 中,一个名为 High Availability Cluster Multi-Processing (HACMP) 的特殊软件能够提供冗余和高可用性来满足这样的需求。本文将简要介绍 HACMP,并演示如何设置和配置一个简单的双节点集群。 常用缩略词I/O: 输入/输出NAS: 网络附接存储SAN: 存储区域网VLAN: 虚拟局域网WAN: 广域网运行中的 HACMPHACMP 的设计目标是以最少的停机时间来保持资源高度可用,其实现方法是通过允许多个 IBM System p 服务器访问资源的方式来收集资源。HACMP 以逻辑方式管理磁盘、网络、应用程序资源,根据可用性和首选项将控制权交付给单个机器。从系统管理员角度看,HACMP 背后的理念是保持所有资源尽可能冗余,从而在所有层面上确保高可用性。 图 1 展示了一个简单的 HACMP 配置。图 1. 简单的 HACMP 配置在这里,两个 System p 服务器共享一个公共 SAN 存储,并在两个网络上通信。它们之间共享一组 IP 地址、一些 Logical Volume Manager (LVM) 资源和应用程序控件 — 均通过 HACMP 管理。 其中一个服务器被视为 “活动的”,控制着这些资源,而另一个服务器闲置,随时准备在必要时接管工作,如 图 2 所示。 图 2. 活动和闲置服务器当部分物理资源出现可用性问题时,比如有些线路被意外拔出,HACMP 将感知这些问题并让另一个服务器接管工作。这些资源的可用性将出现短暂中断,但随后一切恢复正常,就像还在原来的机器上一样,没有任何区别,如 图 3 所示。 图 3. HACMP 在资源失败时控制故障转移 一旦问题硬件恢复正常,这些资源可以保持在原地,也可以返回原始服务器。这完全取决于管理员的决定。 但是,硬件故障并不是导致资源从一个服务器转移到另一个服务器的惟一原因。这种技术也可用于操作系统升级、固件维护以及其他可能需要停机的活动,从而向这些活动添加 HACMP 的多用性和有用性。 关键 HACMP 术语以下术语将贯穿本文始终,有助于理解对 HACMP 的探讨: 集群:运行 HACMP 的多个服务器的逻辑分组。节点:集群中的单独服务器。网络:尽管这个术语通常指大范围的计算机对计算机通信(比如 WAN),但在 HACMP 中,网络 指的是两个服务器之间的通信区域的逻辑定义。 启动 IP:这是一个节点在首次激活并变为可用时使用的默认 IP 地址。通常 — 如本文所示 — 启动 IP 是一个不可路由的 IP 地址,设置在集群中所有节点都可访问的一个隔离 VLAN 上。 持久 IP:这是一个节点作为其常规通信方式使用的 IP 地址。通常,系统管理员通过这个 IP 访问该节点。 服务 IP:这是可以在多个节点之间 “流动” 的 IP 地址。通常,用户通过这个 IP 地址访问集群中的资源。 应用程序服务器:这是一个逻辑配置,告知 HACMP 如何管理应用程序,包括启动和停止应用程序,应用程序监控,以及应用程序调优项。本文只关注启动和停止应用程序。 共享卷组:这是 HACMP 托管的一个卷组。您必须对将在服务器之间共享的磁盘资源使用 HACMP,而不是通过操作系统配置卷组、逻辑卷和文件系统这样的 LVM 结构。 资源组:这是集群中的节点能够管理的服务 IP 地址、应用程序服务器和共享卷组的一个逻辑分组。 故障转移:这是资源组从一个节点转移到另一个节点的情形。发生故障转移的情况有两种:一是系统管理员指示集群中的节点执行故障转移;二是出现灾难性应用程序或服务器故障的情况迫使资源组转移。 故障恢复/回退:这是在故障转移发生后将资源组移回其最初在其上运行的原始节点的操作。 心跳:这是通过 HACMP 网络传输,用于检查和确认资源可用性的信号。如果心跳被中断,集群可能会根据配置发起一次故障转移。 准备工作您必须先执行几个步骤,而后才能配置一个 HACMP 集群并使其可用。第一步是确保将用于这两个服务器的硬件尽可能相似。处理器数量、内存大小、以及 Fibre Channel 和 Ethernet 适配器的类型应该完全一样。如果您正在使用逻辑分区(LPAR)或虚拟 I/O(VIO)技术,应确保一致:不要混合硬件策略,比如在一个节点上使用 logical Host Ethernet Adapters (LHEA),在另一个节点上使用标准 4 端口 Ethernet 适配器。 不要使用开发服务器多年来,我见识了几个不同的公司中的许多环境,其中,将集群中的一个节点声明为 “生产” 服务器,另一个节点声明为
显示全部