文档详情

数据分析基础教程.doc

发布:2025-02-16约1.8万字共20页下载文档
文本预览下载声明

数据分析基础教程

TOC\o1-2\h\u32149第1章数据采集与预处理 3

90561.1数据来源与类型 3

206011.1.1数据来源 3

225811.1.2数据类型 3

52721.2数据采集方法 4

88601.3数据预处理流程 4

136271.4数据清洗与规范化 4

298971.4.1数据清洗 4

19361.4.2数据规范化 4

29656第2章数据可视化 5

139172.1可视化工具介绍 5

146302.2常用图表类型 5

287872.3数据可视化技巧 5

285462.4可视化设计原则 6

6047第3章描述性统计分析 6

130193.1基础统计学概念 6

235853.1.1数据类型 6

36613.1.2变量 6

207333.1.3随机变量 7

50603.2频数分布与描述性统计量 7

101363.2.1频数分布 7

85903.2.2描述性统计量 7

300843.3数据分布特征分析 7

198523.3.1数据分布形态 7

157203.3.2数据分布的对称性 7

273663.3.3数据分布的离散程度 7

318453.4离散程度与相关性分析 8

16493.4.1离散程度分析 8

182803.4.2相关性分析 8

22306第4章假设检验与推断统计 8

82644.1假设检验概述 8

192714.2单样本假设检验 8

104064.3双样本假设检验 8

246714.4方差分析与回归分析 9

18658第5章数据挖掘与特征工程 9

88965.1数据挖掘基本概念 9

214125.1.1数据挖掘的定义 9

234105.1.2数据挖掘的起源与发展 9

130025.1.3数据挖掘的主要应用领域 9

260905.2数据挖掘任务与算法 10

206735.2.1数据挖掘任务 10

134475.2.2数据挖掘算法 10

188245.3特征工程方法 10

5055.3.1特征工程的概念 10

22935.3.2特征提取方法 11

243275.3.3特征选择方法 11

266075.4特征选择与特征降维 11

18635.4.1特征选择与特征降维的区别与联系 11

104335.4.2特征选择方法 11

319365.4.3特征选择与特征降维的应用 11

29358第6章时间序列分析 12

106496.1时间序列基本概念 12

121346.2时间序列分解 12

646.3时间序列预测模型 12

2896.4时间序列分析应用 13

5540第7章聚类分析 13

323427.1聚类分析概述 13

200977.2常用聚类算法 13

21577.2.1Kmeans聚类算法 13

163367.2.2层次聚类算法 14

319767.2.3密度聚类算法 14

91647.2.4高斯混合模型聚类算法 14

155637.3聚类功能评估 14

41557.3.1轮廓系数 14

92957.3.2同质性、完整性和Vmeasure 14

163437.3.3调整兰德指数(AdjustedRandIndex,ARI) 14

74607.4聚类分析应用 15

40977.4.1数据挖掘 15

19977.4.2机器学习 15

74737.4.3图像处理 15

237757.4.4模式识别 15

31675第8章关联规则挖掘 15

115568.1关联规则基本概念 15

143038.1.1定义 15

81838.1.2基本要素 15

243898.1.3关联规则分类 15

187668.2关联规则挖掘算法 16

100568.2.1Apriori算法 16

156968.2.2FPgrowth算法 16

78778.3关联规则评估 16

136778.4关联规则应用 16

3918第9章机器学习基础 17

315639.1机器学习概述 17

43289.1.1定义与分类 17

122939.1.2发展历程 1

显示全部
相似文档