文档详情

数据仓库主题设计与元数据设计.docx

发布:2018-06-13约7.15千字共9页下载文档
文本预览下载声明
 HYPERLINK /end/archive/2012/07/28/2613352.html 数据仓库主题设计及元数据设计 3.4 明确仓库的对象:主题和元数据 ? 大多数商务数据都是多维的,所以采集和表示三维以上的数据不能完全借用业务数据库设计中的方法,必须有一种新的方法来表达多维数据。现阶段流行的有2种方 法,一是面向对象方法,即把商务数据抽象为对象,再使用Rational Rose等对象建模工具来表达这些对象;另一种方法就是使用信息包图,这是一种简便且高效的方法,在项目中使用的普及率很高。 ? 信息包图实际上是自上而下数据建模方法的一个很好的工具。自上而下的建模技术从用户的观点开始设计。用户的观点是通过与用户交流得到的,可以进一步明确用 户的信息需求。自上而下的方法几乎考虑了所有的信息源,以及这些信息源影响商务活动的方式,它使得设计者可以围绕着一个通常的主题或商务??域进行信息包的 开发。 ? 下面就详述如何通过信息打包技术建立信息包图,从而确定数据仓库中的主题和元数据。 3.4.1 信息打包技术 1.信息打包技术的基本使用 ? 信息打包法是一种自顶向下的设计方法,它从管理者的角度出发把焦点集中在企业的一个或几个主题上,着重分析主题所涉及数据的多维特性。此法具体分4个阶段: ? (1)采用自顶向下的方法对商务数据的多维特性进行分析,用信息打包图表示维度和类别之间的传递和映射关系,建立概念模型。其中类别是按一定的标准对一个维度的分类划分,如产品可按颜色、质地、产地和销地等不同标准分类。 ? (2)对企业的大量的指标实体数据进行筛选,提取出可利用的中心指标。其中指标也称为关键性能指标和关键商务测量的值,是在维度空间衡量商务信息的一种方法。比如产品收入金额、原材料消耗、补充新雇员或设备运行时间等都可以叫做指标。 ? (3)在信息打包图的基础上构造星形图,对其中的详细类别实体进行分析,进一步扩展为雪花图,建立逻辑模型。 ? (4)在星形图和雪花图的基础上,根据所定义数据标准,通过对实体、键标、非键标、数据容量、更新频率和实体特征进行定义,完成物理数据模型的设计。 ? 信息包图可以帮助用户完成以下工作: l 定义某一商务中涉及的共同主题范围,例如:时间、顾客、地理位置和产品。 l 设计可以跟踪的、确定一个商务事件怎样被运行和完成的关键商务指标。 l 决定数据怎样被传递给数据仓库的用户。 l 确定用户怎样按层次聚合数据和移动数据。 l 决定在给定的用户分析或查询中实际包含了多少数据。 l 定义怎样访问数据,它的进入点是什么。用户想访问哪里,以及怎样引导进入信息包。 l 估计数据仓库大小。 l 确定一个数据仓库里数据的更新频率。 l 制定信息怎样被打包才能更好地提供给用户。 ? 图3-24是一个空白的信息包图。注意信息包图上面的横线,这里要写上信息包的说明。可以有选择地填上概括说明和详细说明或者说明信息包图描述的是什么信 息。而阴影部分就是代表在一定的维度和类别下的度量指标,这部分体现的就是数据分析的主要任务,在制作信息包图时需要和用户一起完成。 ? 在以后对AdventureWorksDW数据仓库的分析中,主要是对Adventure Works Cycles公司的销售情况进行分析,根据前面对需求的分析,结合信息打包法的4个阶段,可以通过如下的方法建立信息包图。 ? (1)获取各个商务部门对商务数据的多维特性分析结果,确定影响销售的维度,这里可以提炼出日期、区域、产品、客户年龄和客户状况等5个维度。 ? (2)对每个维度进行分析,确定它与类别之间的传递和映射关系,如在AdventureWorks业务数据库中,日期有年、季度和月甚至更小的级别,而区域一般就分为国家、地区、城市和具体的商店。 ? (3)确定用户需要的指标体系,这里以销售情况作为事实依据确定相关的销售指标,如实际销售、计划销售、预测销售、计划偏差和预测偏差等。 ? 有了以上的分析,就可以画出销售分析的信息包图,如图3-25所示,其他分析需求的信息包图可以用类似的方法表示。 ? (4)这一步可以在信息打包图的基础上构造星形图,如图3-26所示。然后根据实际情况,把详细类别实体连接到星形图中就可以得到企业数据仓库的雪花模 型。如在这里的AdventureWorks业务数据库中,已经通过表“ProductCategory”、“ProductSubcategory”和 “Product”对产品进行了层次分类,把它们挂到图3-26的星形图中可以形成图3-27所示的雪花架构图。 ? 注意,按照设计惯例,指标实体、维度实体和详细类别实体分别用矩形、菱形和六角形表示。 ?
显示全部
相似文档