文档详情

数据立方体技术在电力数据统计探析中应用及探究.doc

发布:2017-06-06约字共7页下载文档
文本预览下载声明
数据立方体技术在电力数据统计探析中应用及探究   摘 要:数据立方体是一类多维矩阵,让用户从多个角度探索和分析数据集,即它允许以多个维度对数据进行建模和观察,数据立方体技术是数据仓库的核心技术。本文以电力系统数据统计分析工作为例,介绍了数据立方体技术的原理,研究探讨了数据立方体技术在电力系统数据统计分析工作中的运用,通过建立基于数据立方体模型的电力数据统计分析系统,不但可以实现运行轻量级数据分析工具,而且满足了当前电网建设运行数据统计分析灵活、多样的需求 关键词:数据立方体模型 数据挖掘 轻量级工具 中图分类号:TM73 文献标识码:A 文章编号:1674-098X(2016)11(a)-0009-02 电网建设运行数据的采集与分析,是全面快速了解电网状态并指导后续工作开展的一项重要工作。电力数据统计分析需要对数据进行快速提取并进行灵活、多样的分析,现有电网中涉及电力运行分析的相关业务系统繁多,数据大部分面向业务虽有报表统计模块,却难以完全适应此需求。通过在电力数据统计分析管理系统中建立数据立方体模型,可以实现运行轻量级数据分析工具,满足当前电力数据统计分析工作的需要 1 基于数据立方体技术数据分析模型建立 1.1 数据立方体 数据立方体是一类多维矩阵,通常一次同时考虑三个因素(维度),但并不局限于三个,在实际中常常用多个维度来构建数据立方体 多维矩阵是数据立方体分析的基础,涉及2个重要概念:事实和维度。事实即分析的目标数据,如数量、金额等,维度即事实信息的属性,如对应的时间、设备类型、产权单位等。数据立方体是根据用户对数据挖掘的要求确定维及维层次而生成的多维数据集合。每个数据立方体是一个三维结构,x、y、z轴分别表示数据立方体的三个维度。x轴是时间轴,其时间单位是该层的统计粒度;y轴是属性轴,表示统计针对的记录类型;z轴是统计方法轴,表示采用的统计方法 1.2 数据立方体的建立与提取 构建在数据库中的数据立方体并非如数据立方体字面意思直观,而是通过二维数据表形式进行组织与存储。通过将y轴的维度与z轴的统计值转化为二维表格中的列,x轴时间单位作为记录频率进行定期数据获取并存储到数据立方体所在数据库中 (1)数据列重定义。大部分系统因为编码技术特点,开发人员往往使用英文字母与数字组合作为表格与字段名称,在客户展现端使用相应意义的中文显示。然而通过表格关联的字段,数据立方体视图在生成时按照计算机特点仍然使用英文字母与数字方式显示,由于需要考虑数据立方体生成灵活性,需要在数据库中针对表格和字段进行重定义,利用系统表格进行表名和字段名称中文与字母的映射,满足用户随意利用系统表关联建立视图工作方式 (2)计算列实现。数据立方体中的指标列,既可以包含个数、长度、金额等原始表格数据列,也可以包含诸如平均数、求和、乘积等计算值。可利用数据库定义的多种函数进行计算列生成 (3)维度递进实现。由于一些维度存在一定的层次结构特性,故而维度的定义与组织往往使用树状层次结构实现。递进维度是多个相关维度相互嵌套的一种形式,是实现数据立方体数据切块或切片的基础,通过组织好维度的树状菜单,可实现基于维度树的数据向上向下切片功能 在数据提取上采用手工提取与系统获取相结合,通过系统统计周期即数据立方体中y轴频率对数据立方体中数据进行上一周期数据进行复制到本周期默认数据,相应数据管理单位通过对默认数据的修改填报完成各个数据立方体数据的填充。数据立方体主要采用自动化生成,由于电力数据统计分析数据管理需具备闭环管理功能,故采用数据自动生成,通过任务接收、提供对外标准接口,提供不同系统条件下数据填报由人工转入自动化接口 2 系统构建 本系统通过B/S结构进行开发,用户客户端通过浏览器进行操作,服务端进行数据的存储和对外发布管理,实现基于省市县三级管理单位电力运行分析数据设备、缺陷、业务等数据的填报和报表统计分析管理。系统使用三层结构开发,分为数据层、逻辑层和应用层。数据层负责基础台账数据的存储,使用SQL SERVER 数据库进行管理,逻辑层负责数据填报与统计数据库操作逻辑与结果反馈功能,应用层使用基于Ajax页面无刷新技术的富客户端显示技术与操作用户进行交互 3 数据挖掘实际运用 3.1 数据切片 数据立方体想要通过统计图进行展示,就需将数据立方体进行切片。通过数据切片,实现数据立方体中单一维度的分解,通过单位切片可以分析不同单位的缺陷分布统计图 3.2 数据切块 数据切块主要包括两种方式,单一维区间切块和多维区间切块。单一维区间切块在本系统中应用较多。多维切块是指在两个或多个维度上选取相应的数据范围进行切块的方式。例如在缺陷数据切块中时间维度选择2015年,地区维度选择
显示全部
相似文档