信用卡数据仓库系统设计毕业论文.doc
文本预览下载声明
信用卡数据仓库系统设计毕业论文
目 录
绪论 1
第一章 数据仓库简介 1
1.1 数据仓库出现的背景 1
1.2 数据仓库的特性 2
1.3 数据仓库的技术要求及需要解决的问题 2
1.4 数据仓库系统与OLTP系统的比较 3
1.5 本章小结 3
第二章 可行性分析与需求分析 4
2.1可行性分析 4
2.2需求分析 4
2.3 本章小结 11
第三章 项目概述 12
3.1 项目背景 12
3.2 项目总体描述 12
3.3 项目内容描述 12
3.4 本章小结 13
第四章 信用卡中心数据仓库项目总体设计 14
4.1 项目总体设计思路 14
4.2 项目整体流程规划 14
4.3 项目总体设计原则 15
4.4 本章小结 15
第五章 信用卡中心数据仓库项目详细设计 16
5.1 项目的概念模型设计 16
5.2 项目的逻辑模型设计 16
5.3 项目的物理模型设计 22
5.4 项目的物理数据库设计 24
5.5 ETL调度的设计 29
5.6 用Cognos工具展示报表的表样的设计 30
5.7 本章小结 32
第六章 项目的实现及报表展示 33
6.1 系统环境需求 33
6.2 项目实现过程 33
6.3 项目实现过程中用到的ETL算法 34
6.4 项目报表展示 35
6.4 本章小结 38
后记 39
致谢 39
参考文献 40
附录一: 41
1)项目中用到的相关工具及技术介绍 41
2)配置运行环境时需要注意要点 42
附录二: 44
1)项目包里的“PRO_CREDITCARD”文件夹下的各种PL文件说明 44
2 )PERL部分脚本代码示例 46
绪论
随着我国市场经济的繁荣和发展,国内信用卡业也获得了飞速发展。伴随着信用卡业务量的不断增长,国内信用卡行业的市场竞争也日趋激烈。因此各大银行需要建立专门的组织机构和专业队伍从事数据分析工作。数据分析的内容包括为业务管理提供统计报表,在市场营销、风险管理、客户关系管理等方面,利用报表分析工具对信用卡数据进行深度的挖掘,利用分析成果指导业务决策。
本课题基于数据仓库和数据集市的基本理论,以实际开发过程和开发成果为基础,主要从总体技术方案和数据库设计两个方面,描述了某银行信用卡数据分析集市的设计和实现。主要内容包括以下几方面:数据仓库平台 ETL技术 作业调度 数据模型建设 cognos报表展示。
数据仓库简介
1.1 数据仓库出现的背景
在数据库技术的支持下,一大批成熟的业务信息系统投入运行,为企业发展做出了巨大贡献。各类信息系统大多属于面向事务处理的OLTP系统,经过多年的运行,积累了大量的数据,而管理决策层对数据分析基础平台的需求却日益强烈。
数据仓库概念的提出者是美国著名信息工程专家William Inmon博士,他在90年代初提出了数据仓库概念的一个表述。他认为:“数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策和信息的全局共享。”它的出现主要由两方面的因素:
需求的变化。
业务系统的建设逐渐完善。
分析类需求不断增加。
不断增加的信息孤岛导致数据集成问题不断增加。
技术发展非常迅速。
关系数据库技术日趋成熟。
报表和复杂查询处理起来非常困难。
各个系统之间数据不一致。
1.2 数据仓库的特性
数据仓库的特性有以下几个:
面向主题的(Subject Oriented):是指数据仓库内的信息是按主题进行组织的,而不是像业务支撑系统那样是按照业务功能进行组织的。
集成的(Integrated):是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息。
非易失的(Non-Volatile):数据仓库的数据通常以批量方式加载和被访问,历史数据一般不被更新。当产生信息的后继变化时,变化会被记录下来。这样,数据仓库中就保留了数据的历史状况。
随时间变化(Time Variant):是指数据仓库内的信息并不只是反映企业当前的状态,而是记录了从过去某一时点到当前各个阶段的信息。通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。而信息本身相对稳定,是指一旦某个数据进入数据仓库以后,一般很少进行修改,更多的是对信息进行查询操作。
依据上面的定义,有人可能会把数据仓库简单地理解为仅仅是一个大型的数据存储机制,是一个静态的概念。实际上,数据仓库更像一个过程,这个过程涉及数据的收集、整理和加工,生成决策所需要的信息,并且最终把这些信息提供给需要这些信息的使用者,供他们做出改善业务经营的正确决策。数据仓库的重点与要
显示全部