基于遗传算法的股票市场选择模型.doc
文本预览下载声明
基于遗传算法的股票市场选择模型
摘 要:为提高投资者在股票市场的收益,解决在证券投资中股票选择这一重要问题,提出一种基于遗传算法的股票选择模型。算法以上市公司的财务指标为样本特征,为克服 K-means 算法的不稳定性,采用基于遗传算法的 K-means 算法对同一板块股票进行聚类分析,剔除财务指标较差的一类中的股票。对筛选条件编码,为解决传统遗传算法处理复杂问题时存在的过早收敛现象,提出改进的遗传算子,利用改进的遗传算法寻找使股票市场投资收益最大化的选股模型参数。实验结果表明,该算法在股票选择上具有较好的效果,可供市场投资者借鉴。
关键词:股票选择;遗传算法;聚类分析;投资决策;组合优化
1 引言
当今社会人们的理财投资意识日益增强,且越来越多的投资者将眼光投向了股票市场。虽然股票可以给投资者带来可观的收益,但投资者要想获得很好的投资回报,就得利用合理科学的投资策略来选择股票进行投资[1]。
股票选择从基本面而言,就是对上市公司的内在价值进行评估[2]。股票市场具有的长期记忆性使得可以通过数据分析找出股票价格或收益率的长期相关性,同时股票市场具有非线性[3],应用智能算法可以提高分析的精确度和鲁棒性。现有的很多关于股市的研究主要是应用优化算法对股价和股市态势做出预测。如文献[4]
提出一种基于遗传算法的粗糙集属性约简方法和神经网络相结合的模型来预测股价。文献[5]提出基于离群特征模式的支持向量机模型来预测股价波动。这些研究限于对单个股票或大盘价格的预测,对投资者的投资决策缺乏全面指导性。对于股票选择,最传统的基于基本面分析的股票选择方法有欧奈尔基本面 CAN SLIM 法则、朱雀丁远指数中性策略等经典模型[6]。这些模型大多是研究者通过对历史数据的分析和个人经验提出的,虽然具有一定的效果,但是股票筛选精度一般,灵活性较差。文献[7]定义了股票稳定性值,结合遗传算法和贪婪算法提出股票选择规划方法。此方法很好地规
168 2016,52(18) Computer Engineering and Applications 计算机工程与应用
避了股票选择风险,但是没有实现收益最大化。文献[8]通过合理地选取贝叶斯分类器的参数对股票进行分类得出高回报股票组合,但是实验数据受大盘形势影响缺乏贝叶斯分类需要的独立性,算法预测精度一般。
本文提出一种改进的选股策略,利用基于遗传算法改进的 K 均值聚类算法和改进的遗传算法分析上市公司的财务指标,得出合理的股票选择模型。首先在大量股票样本的初步处理中,采用基于遗传算法的 K 均值算法,对财务指标进行聚类分析,从而过滤股票样本。然后利用改进的遗传算法,使用自适应的交叉算子与变异算子,来寻找最佳选股模型参数,从而找出真正具有投资价值的股票。
2 股票选择模型的建立
指标及样本的选择
基本面选股所涉及的因素主要是上市公司的财务指标,包括每股指标、盈利能力、成长能力、营运能力、现金流量、偿债能力和资本结构等指标。所以本文选取了较能反映这些能力的十项重要指标,如表1 所示。
表1 财务指标表 指标类别 指标名称 指标性质 每股指标 每股收益/元 正指标 盈利能力 总资产净利润率/% 正指标 盈利能力 销售净利率/% 正指标 盈利能力 净资产收益率/% 正指标 成长能力 净利润增长率/% 正指标 成长能力 总资产增长率/% 正指标 营运能力 应收账款周转率/次 正指标 营运能力 存货周转率/次 正指标 偿债及资本结构 资产负债率/% 逆指标 现金流量 经营现金净流量对负债比率/% 正指标
板块是由具有共同特征的股票组成的群体。股票板块可以根据上市公司所属的行业、地域、特色题材等多种角度来划分[9]。本文选取了发电设备板块的 50 家上市公司的股票作为样本。
模型求解策略
聚类是将对象集合分组为多个类,同一类中的对象有很大的相似性。目前国内股票市场根据上市公司的财务状况,公司股票一般分为:绩优股、一般股和垃圾股。所以本文采用基于遗传算法改进的 K 均值聚类算法将样本数据根据财务指标属性聚类为三类,即 k = 3 。剔除垃圾股类中的股票样本,保留绩优股和一般股类中的样本。这样先从大量数据中过滤掉不利于投资的股票,减少了之后股票选择的数据量,提高了选择的准确率和效率。
求得最佳的股票选择模型可以看作是一个复杂的组合优化问题,目标就是求得目标函数的最优解,遗传
算法具有很强的全局搜索能力,利用改进的遗传算法可以很好地求解这一问题。
模型的建立
模型参数
j 代表股票所属上市公司的第 j(0 j 11) 个财务
指标(对应如表 1 所示)。 x11 代表该只股票的回报率。
Si 代表第 i 只股票样本(0 i n +
显示全部