基于数据挖掘的数量化模型选股分析平台-软件工程专业论文.docx
文本预览下载声明
万方数据
万方数据
独 创 性 声 明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。
签名: 日期: 年 月 日
论 文 使 用 授 权
本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。
(保密的学位论文在解密后应遵守此规定)
签名: 导师签名:
日期: 年 月 日
万方数据
万方数据
摘 要
摘 要
伴随着计算机、信息技术的飞速发展,信息数据的存储和获取技术也得到了 前所未有的发展,各个行业领域都产生了大量数据,而从这些数据中怎样提取到 对我们有用的数据,仅仅按照常规的方法已很难去解决,而近年来产生的数据挖 掘则技术则可以发现那些隐藏在海量数据的、具有一定规律的、对我们有用的信 息数据,所谓数据挖掘是一种应用模型发现知识、提取有用数据的过程,我们可 以用这些数据进行分析和预测。
股票市场是我国市场经济不可缺少的组成部分,在经济发展中起着不可代替 的作用,如何能够比较正确的分析和预测股票未来的走势,对金融投资方面来说 有着非常重要的意义。但是股票的价格走向是受很多因素的影响,所以说炒股是 一个有着非常不确定性的复杂过程。对它建立某种固模型是有一定困难的,同时 股票相关的数据越来越庞大,而这些数据中常常包含着股票价格走势的规律性。 而近些年来新兴发展起来的据挖掘技术则是一种可以满足从这种海量数据之中, 获取有价值的数据的新的数据处理技术,因而如何对股票数据利用挖掘技术进行 分析和处理,并做出趋势预测具有重大的理论和实际的意义。
本论文主要讨论了基于现金流的选股模型,将其理论数量化抽象生成一套关 于选择股票的公式分类规则,并对选择的样本数据进行预处理,转换构造挖掘所 需要指标和属性,然后利用数据挖掘技术中的公式分类技术和数据库中的一些聚 集函数,结合 SQL 语句对股票数据进行分析、预测,并对挖掘结果进行了必要的 检验。根据实际结果证明从模型获得的公式分类算法进行选股是可行的。用户可 以根据这类规则快速的选择出有投资价值的个股,然后进一步的去分析和预测或 直接投资。
最后根据所论证挖掘模型以及分类所用算法设计并开发了一个实际的模型分 析选股平台,并对其功能和性能等进行了必要的测试,它可以对股票数据进行多 维的分析预测,作为投资者的投资决策的辅助工具,是利用数据挖掘技术结合华 尔街著名选股模型理论,分析大量与股票相关的信息数据,并做出未来走势预测, 具有一定实用意义。
关键词:数据挖掘,分类算法,数据库,模型选股,股票分析
I
ABSTRACT
ABSTRACT
With the rapid development of computer and information technology, the technology of information data collection and storage has gotten an unprecedented improvement, every fields has produced a large amount of data, how to get the information that we are need from them, it was difficult to solve that if just use the conventional method, but the technology of data mining can found the information which have some special rules and useful, but were hidden, it is a process to discover knowledge and get useful data, we can use this data to analyze and forecast.
Stock market as an important part of the market economy, plays a very important role in our country. How to analysis and forecasts th
显示全部