数据挖掘与预测分析入门指南.doc
数据挖掘与预测分析入门指南
TOC\o1-2\h\u25621第一章数据挖掘基础 3
24221.1数据挖掘概述 3
273441.2数据挖掘任务与流程 3
223331.2.1数据挖掘任务 3
45351.2.2数据挖掘流程 4
39601.3数据挖掘常用算法简介 4
18775第二章数据预处理 4
46742.1数据清洗 4
256302.2数据集成 5
307542.3数据转换 5
125412.4数据归一化与标准化 6
12970第三章数据摸索性分析 6
184573.1数据可视化 6
68753.2数据统计描述 7
5373.3数据分布分析 7
91533.4关联规则挖掘 7
5844第四章监督学习 8
232754.1线性回归 8
16364.2逻辑回归 8
280754.3决策树与随机森林 8
184174.4支持向量机 9
24894第五章无监督学习 9
214225.1聚类分析 9
238835.2主成分分析 9
25225.3聚类算法应用 9
90605.4聚类评估与选择 10
18127第六章预测分析 10
254446.1时间序列分析 10
133986.1.1时间序列的基本概念 10
235176.1.2时间序列分析方法 10
109776.2回归预测 11
284146.2.1回归预测的基本概念 11
187796.2.2回归预测方法 11
224206.3分类预测 11
247486.3.1分类预测的基本概念 11
181886.3.2分类预测方法 11
307566.4预测模型评估与优化 11
155296.4.1预测模型评估指标 12
67546.4.2预测模型优化方法 12
10059第七章特征工程 12
221467.1特征选择 12
118917.1.1过滤式特征选择 12
326537.1.2包裹式特征选择 12
93257.1.3嵌入式特征选择 12
175277.2特征提取 13
293827.2.1主成分分析(PCA) 13
197817.2.2拉普拉斯特征映射 13
70317.3特征降维 13
117777.3.1特征选择降维 13
318577.3.2特征提取降维 14
180867.4特征重要性评估 14
123927.4.1基于模型的特征重要性评估 14
79887.4.2基于模型的特征选择方法 14
32523第八章模型评估与选择 14
24338.1交叉验证 14
82198.1.1K折交叉验证 14
242038.1.2留一交叉验证 15
286568.2模型功能指标 15
69948.2.1准确率(Accuracy) 15
269908.2.2精确率(Precision) 15
3848.2.3召回率(Recall) 15
62788.2.4F1值(F1Score) 15
170108.3模型选择准则 15
45168.3.1均方误差(MeanSquaredError,MSE) 15
121228.3.2交叉熵(CrossEntropy) 15
76218.3.3赤池信息准则(AkaikeInformationCriterion,C) 15
326548.4模型调整与优化 16
20568.4.1调整模型参数 16
16078.4.2特征选择与特征工程 16
84388.4.3集成学习 16
151928.4.4模型融合 16
27859第九章实战案例 16
221869.1聚类分析案例 16
239949.1.1案例背景 16
318689.1.2数据处理 16
162089.1.3聚类算法选择 16
104229.1.4模型训练与评估 16
269599.1.5结果分析与应用 17
148069.2回归预测案例 17
141429.2.1案例背景 17
164449.2.2数据处理 17
304799.2.3回归算法选择 17
73949.2.4模型训练与评估 17
198309.2.