数据分析基础教程.doc
数据分析基础教程
TOC\o1-2\h\u32149第1章数据采集与预处理 3
90561.1数据来源与类型 3
206011.1.1数据来源 3
225811.1.2数据类型 3
52721.2数据采集方法 4
88601.3数据预处理流程 4
136271.4数据清洗与规范化 4
298971.4.1数据清洗 4
19361.4.2数据规范化 4
29656第2章数据可视化 5
139172.1可视化工具介绍 5
146302.2常用图表类型 5
287872.3数据可视化技巧 5
285462.4可视化设计原则 6
6047第3章描述性统计分析 6
130193.1基础统计学概念 6
235853.1.1数据类型 6
36613.1.2变量 6
207333.1.3随机变量 7
50603.2频数分布与描述性统计量 7
101363.2.1频数分布 7
85903.2.2描述性统计量 7
300843.3数据分布特征分析 7
198523.3.1数据分布形态 7
157203.3.2数据分布的对称性 7
273663.3.3数据分布的离散程度 7
318453.4离散程度与相关性分析 8
16493.4.1离散程度分析 8
182803.4.2相关性分析 8
22306第4章假设检验与推断统计 8
82644.1假设检验概述 8
192714.2单样本假设检验 8
104064.3双样本假设检验 8
246714.4方差分析与回归分析 9
18658第5章数据挖掘与特征工程 9
88965.1数据挖掘基本概念 9
214125.1.1数据挖掘的定义 9
234105.1.2数据挖掘的起源与发展 9
130025.1.3数据挖掘的主要应用领域 9
260905.2数据挖掘任务与算法 10
206735.2.1数据挖掘任务 10
134475.2.2数据挖掘算法 10
188245.3特征工程方法 10
5055.3.1特征工程的概念 10
22935.3.2特征提取方法 11
243275.3.3特征选择方法 11
266075.4特征选择与特征降维 11
18635.4.1特征选择与特征降维的区别与联系 11
104335.4.2特征选择方法 11
319365.4.3特征选择与特征降维的应用 11
29358第6章时间序列分析 12
106496.1时间序列基本概念 12
121346.2时间序列分解 12
646.3时间序列预测模型 12
2896.4时间序列分析应用 13
5540第7章聚类分析 13
323427.1聚类分析概述 13
200977.2常用聚类算法 13
21577.2.1Kmeans聚类算法 13
163367.2.2层次聚类算法 14
319767.2.3密度聚类算法 14
91647.2.4高斯混合模型聚类算法 14
155637.3聚类功能评估 14
41557.3.1轮廓系数 14
92957.3.2同质性、完整性和Vmeasure 14
163437.3.3调整兰德指数(AdjustedRandIndex,ARI) 14
74607.4聚类分析应用 15
40977.4.1数据挖掘 15
19977.4.2机器学习 15
74737.4.3图像处理 15
237757.4.4模式识别 15
31675第8章关联规则挖掘 15
115568.1关联规则基本概念 15
143038.1.1定义 15
81838.1.2基本要素 15
243898.1.3关联规则分类 15
187668.2关联规则挖掘算法 16
100568.2.1Apriori算法 16
156968.2.2FPgrowth算法 16
78778.3关联规则评估 16
136778.4关联规则应用 16
3918第9章机器学习基础 17
315639.1机器学习概述 17
43289.1.1定义与分类 17
122939.1.2发展历程 1