文档详情

金融行业的数据挖掘技术研究.docx

发布:2019-10-18约7.55千字共3页下载文档
文本预览下载声明
金融行业的数据挖掘技术研究●李金迎詹原瑞摘要 :数据挖掘就是利用各种技术从海量的数据中发现知识,它具有广阔的应用与前景。文章比较详尽概论总结了数据挖掘的概念、方法、及应用。并且分析、归纳了数据挖掘在金融领域的应用,具体包括趋 金融行业的数据挖掘技术研究 ●李金迎 詹原瑞 摘要 :数据挖掘就是利用各种技术从海量的数据中发现知识,它具有广阔的应用与前景。文章比较详尽概论总结了 数据挖掘的概念、方法、及应用。并且分析、归纳了数据挖掘在金融领域的应用,具体包括趋势预测、客户关系管理、金融 犯罪侦测、风险识别与管理等。 关键词:数据挖掘;金融数据;预测;欺诈侦测;风险识别 我 国金融行业是信息化 起 步比较 早 , 相 对 比 较 成 熟 的 。 在全面实现电子化 的过程中积累了大量的数据 。 这 些 数据背后隐含着大量的 知识与规则 。 而 多 数 机 构 并没 有 挖 掘出这些知识与规则 。 甚至有的企业并没有意识 到它的存 在和 价 值 ,更谈不到挖掘 与利用 。 近 几年随着金融市场的 开 放 , 外资金融机构的进入 , 库 是 面 向 主 题 的 、集 成 的 、相 对稳定的反映历史变 化 的数 据 集 合 。 多数数据挖 掘是基于数据仓库的 ,数 据 仓 库 为 数 据 挖 掘 提 供 有价 值 的 数 据 。 二、 数据挖掘的主要技术 1. 基于神经网络的方法 。由于对非线性数据的快速建 模能 力 , 基于神经网络的 数 据挖掘工具现在越来 越 流行 。 多 种 金 融创新将不断 涌 现 ,竞争也随之不断加剧 。 同 时 也 其 开 采 过 程 基 本 上 是 将 数 据 聚 类 ,然 后 分 类 计 算 权 值 。 神 不 可 避 免 的 是金融 行业面临诸多新的风险 ,这 使 得 金 融 机 构的经营管 理既要进行管理上的 创 新 、 经营业务上的创 经 网 络 很 适合 非线性数据和含噪声 数 据 ,所以在市场数据 库的分析和建模方面应用广泛 。 神 经网络方法是模拟人 脑 信息加工过程 的 一 种 智能 化 信 息 技 术 。 神经元是 一个多输入单输出的信 息 处理 单 元 ,而 且 ,它对信息 的处理是非线性的图 1 是 典 型 的 神 经 元 模 型 。 新 ,又 要及时的规避风险 。 数据 挖掘技术是金融业继信息 化技术之后的另一个 创新点与重要的技术工具 。 一、 基 本 概 念 随 着计算机软硬件技术 、 网 络技术等的飞速发展 ,各 行 各 业 的 数 据 库 中 积 累 了 大 量 的 数 据 ,而 且 每 天 还 在 急 剧 地 增 长,在 这 些海 量的数据中隐藏着大 量 的 、有 用 的 知 识 , 这 些 知 识 表现 为 关 联 、规 则 、趋 势 等 。 而传统地阅读或简单 的数 据 检 索,远不能够及时 提取出那些不同层次 的 知识,数 据的真正价值 远没有被发现与利用 。 这 不 仅造 成 了 信 息 的 浪费,更重要的是企业失 去 商机 。 为了避免这种情况,减 少 损 失 ,寻 找 商 机 , 必须 要有一种能分析大量数 据 的新型的 数 据 分 析 技 术 , 数据挖掘正是这样一 种 技术 , 它 融 和 了 数 据 库 技 术 、人 工 智 能 、统 计 技 术 、机 器 学 习 等 技 术 ,它 能 够 把 海 量的数据被自动地和 智 能地转化为有用的信息 和 知 识。 数 据 挖 掘 (Data Mining)或称为知识发现 ,也 称 为 基 于 数 据 库 的 知识 发 现 ,是通过信息技 术 对大量的数据进行探 索 和 分 析 的 过 程 ,在浩如烟海 的数据中提取有用 、有 效 的 信 息 ,发现有用的模式 与 规律 。 数据挖掘是指在 对 大量的 企 业 历 史 数 据 进 行 探 索 后 ,揭示出其中隐 藏着的规律性内 容 ,并且由此进一步形成模型化 的分析方法 。 通 过数据挖掘还可以建 立 起企业整体或 某 个 业 务过 程局部的不同类型 的模型 。 这些模型不仅可以 描述企业当 前发 展 的 现 状 和 规 律 性 ,而 且可以用来预测当条 件 变化后 可 能 发 生 的 状 况 。 这可以为企业开发新的 产 品和服务 、甚 至于为企业机构的重组提供决策 支持依据 。 x1 wi1 wi2 win Σ θi x2 yi … … xn 图 1 神经元模型 神经元的数学模型可用式 (1),(2)表 示 。 n X=Σwixi-θ i = 1 y=f(X) 由多个神经元组成的神经网络见图 2。 (1) (2) 输出 输入 输出 层 输入 层 隐蔽 层 图 2 典型的神经网络 神 经 网 络采用非线性动力学的方法实现系
显示全部
相似文档