容错技术与容错服务器剖析.ppt
文本预览下载声明
* 如果I/O板再出现问题呢? Passive Backplane SSP SNP I/O I/O CPU 1+1=? Disk Disk SSP 2 MEM 2 X 任何一块I/O板上的任何部件损坏,也不会影响系统的正常运行。正在进行的运算和操作同样象没发生问题一样继续下去。 I/O 板 CPU/MEM 板 * 工作原理比较---集群 I/O CPU 1+1=? MEM 2 I/O CPU 1+1=? MEM 2 Disk 0100010110100010101010111010111010010110001100011101 X 1+2=3 CPU、内存和等待I/O的所有数据丢失,数据库、应用、文件系统都没有被安全关闭 需要时间等待备机检测到故障发生 需要时间和运气进行磁盘组切换、需要时间和运气进行文件系统检查 需要时间重新启动应用程序,需要重新进行一些运算以回到断点 需要时间和运气重新启动数据库并进行数据库修复工作 最重要的是:切换并不一定总是成功!!! 系统 A 系统 B * 集群和容错方案硬软件工作原理比较 通用HA 容错CA 交易丢失 选择新平台 业务延滞 故障 出现 故障 恢复 数据丢失,后期会花费大量的力量来找回 恢复总时间 = 基本系统恢复时间 + 数据库恢复时间 + 应用程序恢复时间 + 网络恢复时间 * 计算机业界对可靠性的定义 方案可靠性 99.999% 99.99% 99.9% 99% 容错服务器 独立服务器 使用外部磁阵的独立服务器 简易的集群系统 消除单点故障的集群系统 大型主机 * 每年的停机成本 .0876 4.38 8.76 Hours unavailable $25,000 per hour $10,000 per hour $5,000 per hour Computing Environment $900.00 $43,800.00 $87,600.00 $400.00 $22,900.00 $43,800.00 $219,000.00 24 x 7 99.9% $2,200.00 99.999% $109,500.00 99.95% Cost of downtime will vary by application .00876 99.9999% $44.00 $88.00 $219.00 Downtime means $$$$........ * $$ $$$ Windows 2003 x 2 2套主机系统 集群部件 以及存储阵列 应用程序和中间件 x 2 系统维护以及停机损失 应用程序和中间件 x 1 集群软件 集群规划实施费用 - 集群设计 - 集群测试验证 - 应用程序设置 简单的单机管理 Win2003 x 1 Rapid Disk Resync 用户成本比较 容错ftServer TCO 比较 一套ftServer Cluster集群 * 2003 美国供电中断是由于集群切换方案的失败 区域供电中断13分钟 * 当我们有彻底避免灾难的方案时为什么还要选择灾难恢复方案呢 灾难恢复 集群方案 灾难预防 容错方案 “Why choose a server designed to recover from a failure, rather than a server designed not to fail?” Vernon Turner, IDC * 内容 容错技术与容错服务器 单机容错 VS.双机热备 容错带给客户的价值 行业应用 * 容错为客户带来价值 Stratus 向客户提供解决方案: 具有连续可用性能力 - 拥有无可比拟的优势 (99.9998+ % uptime) 操作简便性 - 提供具有显著的操作简便性 财务优势 - 产品和解决方案(最小的TCO) * 容错服务器的优势 1. 可用性: 99.99987% vs 99.95% 2. 故障恢复时间 3. 动态数据一致性 4. 应用透明性 5. 生命周期及风险 6. 可维护性 * 内容 容错技术与容错服务器 单机硬件容错 VS.双机热备 容错带给客户的价值 行业应用 * 工业控制系统的应用 ftServer systems: one of first servers to earn the ABB “Industrial IT Certified” designation * 秒 分钟 小时 班组 天
显示全部