数据分析进阶学习指南.doc
数据分析进阶学习指南
TOC\o1-2\h\u30110第1章数据分析基础回顾 5
198831.1数据类型与结构 5
269211.1.1数据类型 5
233441.1.2数据结构 5
269531.2常用数据处理工具 5
157151.2.1编程语言 6
12991.2.2数据库 6
257201.2.3数据处理库 6
234461.3数据可视化基础 6
195271.3.1常用数据可视化工具 6
302781.3.2常见图表类型 6
18818第2章统计分析 6
194132.1描述性统计 6
168212.1.1频数与频率分布 7
222022.1.2集中趋势的度量 7
113112.1.3离散程度的度量 7
176472.1.4分布形态 7
274612.2假设检验 7
129782.2.1常见的假设检验方法 7
185702.2.2假设检验的步骤 7
123722.2.3假设检验中的错误类型 7
296842.3方差分析 7
49402.3.1单因素方差分析 7
94802.3.2多因素方差分析 7
218122.3.3重复测量方差分析 7
139542.4相关性与回归分析 8
59752.4.1相关性分析 8
61592.4.2线性回归分析 8
225142.4.3多元回归分析 8
3864第3章数据预处理 8
36843.1数据清洗 8
181003.1.1缺失值处理 8
199263.1.2异常值检测与处理 8
287183.1.3重复数据删除 8
189763.1.4数据一致性处理 8
2013.2数据集成 8
145943.2.1外部数据导入 8
160443.2.2数据整合 9
66253.2.3数据合并 9
77033.3数据变换 9
1673.3.1数据标准化 9
146713.3.2数据离散化 9
93423.3.3数据归一化 9
166163.3.4特征变换 9
147123.4数据规约 9
284953.4.1特征选择 9
52203.4.2特征提取 9
86493.4.3数据压缩 9
210873.4.4数据降维 9
2623第4章数据挖掘技术 9
189184.1分类算法 9
185734.1.1决策树算法 10
310874.1.2逻辑回归算法 10
284684.1.3支持向量机算法 10
20054.1.4神经网络算法 10
221654.2聚类算法 10
197394.2.1Kmeans算法 10
315294.2.2层次聚类算法 10
200494.2.3密度聚类算法 10
179994.2.4高斯混合模型 10
116854.3关联规则挖掘 11
242264.3.1Apriori算法 11
224944.3.2FPgrowth算法 11
174054.3.3Eclat算法 11
171134.4时间序列分析 11
236964.4.1自回归模型 11
278354.4.2移动平均模型 11
9524.4.3自回归移动平均模型 11
25544.4.4自回归差分移动平均模型 11
28789第5章机器学习进阶 11
1115.1决策树与随机森林 11
145165.1.1决策树原理 12
327655.1.2随机森林概述 12
81365.1.3决策树与随机森林在实际项目中的应用案例 12
198765.2支持向量机 12
45495.2.1支持向量机原理 12
153495.2.2支持向量机的求解方法 12
313875.2.3支持向量机的应用案例 12
256565.3神经网络与深度学习 12
243545.3.1神经网络基础 12
35355.3.2深度学习概述 13
39635.3.3深度学习框架简介 13
239545.3.4神经网络与深度学习在实际项目中的应用案例 13
177705.4集成学习 13
300155.4.1集成学习方法概述 13
221685.4.2常见集成学习算法