第10讲大数据架构设计理论与实践大数据架构设计案例分析三.pptx
第十九章大数据架构设计理论与实践大数据架构设计案例分析某证券公司大数据系统架构应用系统架构设计师第二版
综合知识精讲培训课讲师:邵宗其
考点分析本章主要学习大数据方向软件架构的发展和工作中的实践。根据考试大纲,本小时知识点会涉及案例分析题和论文题(各占25分)。本小时内容侧重于理解性记忆,按照以往的出题规律,部分基础知识点来源于教材,部分考查内容需要灵活运用相关知识点。知识架构如图所示。大数据架构设计理论与实践
系统建设背景某证券作为证券业金融科技领域的先行者和探索者,其系统每天都会产生大量的日志。目前某证券的信息系统运维模式正经历着由自动化运维到智能化运维的转变,因传统监控需要各应用系统独立实现监控并将异常信息发送给运维平台告警,导致运维人员接到告警通知后需分别排查与定位各系统问题,从而大幅增加了沟通工作量与运维复杂性。特别是对于反映系统运行状态的技术指标或业务指标而言,因其大多分散在各个系统当中,很难实现统一管理。为更好地管理和利用日志数据,某证券依托大数据平台强大的数据处理、分析能力,创新打造了基于Kappa架构的实时日志分析平台,平台集日志集中管理、安全审计、业务实时监控、故障快速定位与预警于一体,可支持自动化分析系统功能热点和性能容量情况,进而有效预防可能发生的风险。某证券公司大数据系统架构应用
数据需求与场景实时日志分析平台针对日志数据分析需求重点集中于三大核心功能,即日志智能搜索,可视化分析,全息场景监控。日志智能搜索主要用来满足平台用户快速、便捷地搜索日志的需要,通过采用类似搜索引擎的文本检索方式,可提供分词搜索、全文检索等丰富的搜索功能。同时,为满足用户对日志局部搜索的需求,平台还可对日志内容进行映射转换形成日志指标,并将日志内容搜索转换为日志指标查询。此外,除了基本的关键词搜索外,智能搜索方式也支持正则表达式以应对复杂的搜索场景,通过将日志内容提取转换形成日志变量,以及使用正则表达式筛选日志变量,能够呈现更为精准、专业的搜索结果。日志可视化分析是平台发挥分析价值的利器,通过对各类交易耗时、数据库报错、CPU使用率、网络读写速率、调用错误码等各种交易健康度指标的可视化展示,可高效满足不同部门的日志数据展示需求,同时降低各部门获取信息的门槛,为智能监控、系统优化、业务连续性等提供有效的数据支撑,充分发挥日志数据的应用价值。此外,通过统计分析相应的日志数据,还可预判交易状态、制定应急预案,进一步提高系统的服务能力。全息场景监控主要用于实现对业务处理状态、系统性能容量的实时智能监控和趋势预判,并辅以自动化处理工具,以提高故障的自愈能力。通过自动化监控,运维人员将可以快速进行故障排查和溯源,并针对每一次故障新增监控指标,从而提高监控预警覆盖度。同时,平台还支持基于单指标与多指标的多种异常检测算法,可智能地针对各指标实时变化趋势和抖动程度产生异常点预警,并自动推送到运维平台进行集中展现,从而减少人工干预,提高人机协同的工作效率。某证券公司大数据系统架构应用
系统架构(1)日志采集,即在各应用系统部署采集组件Filebeat,实时采集日志数据并输出到Kafka缓存。(2)日志清洗与解析,即基于大数据计算集群的Flink计算框架,实时读取Kafka中的日志数据进行清洗和解析,提取日志关键内容并转换成指标,以及对指标进行二次加工形成衍生指标。(3)日志存储,即将解析后的日志数据分类存储于Elastic-Search日志库中,各类基于日志的指标存储于OpenTSDB指标库中,供前端组件搜索与查询。某证券公司大数据系统架构应用实时日志分析平台基于Kappa架构,使用统一的数据处理引擎Flink可实时处理全部数据,并将其存储到Elastic-Search与OpenTSDB中。实时处理过程如下:
系统架构(4)日志监控,即通过单独的告警消息队列来保持监控消息的有序管理与实时推送。(5)日志应用,即在充分考虑日志搜索专业需求的基础上,平台支持搜索栏常用语句保存,选择日志变量自动形成搜索表达式,以及快速按时间排序过滤、查看日志上下文等功能。同时,基于可视化分析和全息场景监控可实时展现各种指标和趋势,并在预警中心查看各类告警的优先级和详细信息,进而结合告警信息关联查询系统日志内容来分析解决问题。此外,开发配置中心还提供了自定义日志解析开发功能,并支持告警规则、告警渠道配置。实时日志分析平台技术架构如图19-15所示。某证券公司大数据系统架构应用实时日志分析平台基于Kappa架构,使用统一的数据处理引擎Flink可实时处理全部数据,并将其存储到Elastic-Search与OpenTSDB中。实时处理过程如下