文档详情

金融大数据应用与Python实践课件 第13章 数据挖掘常用方法.pptx

发布:2025-06-02约小于1千字共47页下载文档
文本预览下载声明

;;学习目标:;13.1监督学习;13.1.1回归;6;7;8;线性回归案例结果图:;13.1.2分类;1.感知机模型;感知机模型案例结果图:;2.逻辑回归模型;逻辑回归模型案例结果图:;3.决策树模型;决策树模型案例结果图:;4.随机森林模型;随机森林模型案例结果图:;13.2无监督学习;13.2.1聚类;1.K均值聚类算法;1.K均值聚类算法;1.K均值聚类算法;K均值聚类示例结果图:;13.2.2案例分析——银行客户群体划分;26;13.2.3关联规则分析;28;29;30;31;32;13.2.4案例分析——信用卡推荐;34;13.3时间序列分析;36;ARIMA的全称叫做差分整合移动平均自回归模型,又称作整合移动平均自回归模型,是一种用于时间序列预测的常见统计模型。;ARIMA模型主要由AR、I与MA模型三个部分组成。;ARIMA(p,d,q)模型可以表示为:;ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列,这个模型一旦被识别后,就可以从时间序列的过去值及现在值来预测未来值。;;;在股票市场中,行情的变化与国家的宏观经济发展、法律法规的制定、公司的运营、股票投资者的信心等都有关联。股票行情很难准确地预测,证券分析师的预测只能作为投资者入市操作的参考。本小节以五粮液股票数据为例,结合时间序列及ARIMA模型对股票收盘价进行分析。;本案例以五粮液股票数据为例,具体为自2003年1月1日至2018年8月31日的股票数据,其中2013—2017年的数据作为训练数据。通过对这些数据的训练,实现对2018年1月至2月的股票收盘价的预测,并将预测的结果与爬取的真实股票数据进行绘图对比。(部分数据如下);45;46;本章结束!

显示全部
相似文档