F5 故障排查2016.pdf
文本预览下载声明
F5 故障排查
2016年12月
故障排查之前
清楚的故障描述
- 把问题说清楚是一项很高的技能!
• 拓扑环境
• 用纯文本示意图或visio结构图均可,关键是把结构描述清楚
• 用户需求:
• 总体来说,部署这套F5是实现DNS还是链路选择还是服务器负载均衡?
• 这次故障中相关的VS是为了交付哪个应用? 客户端和服务器分别在哪?
• 用户期望的现象是什么?
• 异常现象
• 一定要先说现象,而不是你的推断!人为推测的结论可能在一开始对问题分析产
生误导
• 对照用户期望的结果,描述实际见到的情况是如何的。
© F5 Networks, Inc 3
清楚的故障描述 (cont.)
• 用明确的语言而非含糊的描述
• 用技术性语言来描述(后面会有详述)
• 用明确的语言来描述(后面会有详述)
• 完成的排障步骤和结果
• 写明实施排障步骤的目的、动作和结果
• 明确的问题
• 明确的问题和希望得到的答复,不要仅仅描述故障现象而没有任何问题,让会让
别人不知所措。
© F5 Networks, Inc 4
用技术性语言描述故障现象
非技术性语言 技术性语言
• 网络不通 • 用浏览器访问站点收到404错误
• 从数据中心里面ping不出去 • 从数据中心内一台PC机(IP为)
ping 互联网上的 地址,PC端
• F5没反应了
显示未收到回包
• 通过https、ssh方式连不上F5的管理IP
或selfIP,通过console连接有输出。
用专业的技术性语言替代非专业的笼统描述
© F5 Networks, Inc 5
用明确的语言描述故障现象
- 试着描述问题的“面”,而不是故障的“点”
• “用IE无法打开”
• 技术性强,但只是点的描述,没有面的拓展,所以不够明确。
• 是否问题仅出现在IE上? 是否仅仅无法打开 这一个网站?
• 尽量对于问题描述中出现的每一个元素,都进行“替换法”测试,以判断该
无素是否为唯一标识。
• 明确的问题描述:
• 用任何浏览器(已尝试IE, FireFox和Chrome,现象一致)都无法打开任何以
结尾的网站(包括, 和
等),收到错误代码404。
• 用任何浏览器打开其它公共网站(如 , 等均正常。
• 域名解析正常,通过QQ、telnet等访问internet资源正常无故障。
© F5 Networks, Inc 6
明确故障现象的过程,就是解决故障的过程
© F5 Networks, Inc 7
部署模式的差别
Client side and server side context
OSI Stack
显示全部