数据分析与处理作业指导书.doc
数据分析与处理作业指导书
TOC\o1-2\h\u7273第一章数据采集与预处理 3
80911.1数据采集方法 3
173471.1.1网络爬虫采集 4
286681.1.2API接口调用 4
315991.1.3数据库导入 4
230851.1.4手动采集 4
262061.2数据清洗与预处理 4
14031.2.1数据去重 4
261791.2.2数据缺失值处理 4
117771.2.3数据格式统一 4
274491.2.4数据规范化 5
15916第二章数据可视化 5
35032.1数据可视化概述 5
198452.2常用可视化工具介绍 5
114142.2.1Tableau 5
303582.2.2PowerBI 5
230822.2.3PythonMatplotlib 5
177002.2.4R语言 6
296382.2.5ECharts 6
182002.3数据可视化技巧与实践 6
260272.3.1选择合适的图表类型 6
240092.3.2保持图表简洁明了 6
249892.3.3使用合适的颜色搭配 6
67932.3.4注重图表的交互性 6
183672.3.5结合文字说明 6
22072.3.6优化图表布局 7
151392.3.7实践案例分析 7
6171第三章描述性统计分析 7
265863.1描述性统计方法 7
143643.1.1频数分布 7
283003.1.2中心趋势度量 7
257333.1.3离散程度度量 8
189223.2数据分布与趋势分析 8
190053.2.1数据分布分析 8
257073.2.2数据趋势分析 8
323533.3数据异常值检测 8
23543.3.1箱线图法 8
266433.3.2标准差法 9
289623.3.3基于聚类分析的异常值检测 9
14802第四章假设检验与推断性统计分析 9
300384.1假设检验概述 9
323824.2常用假设检验方法 9
313894.2.1单样本t检验 9
80434.2.2双样本t检验 9
14584.2.3卡方检验 10
133694.3结果解释与推断 10
9792第五章相关性分析 10
128765.1相关性概念与度量 10
58725.2相关系数计算与应用 11
2785.2.1皮尔逊相关系数 11
89895.2.2斯皮尔曼秩相关系数 11
249745.2.3肯德尔秩相关系数 11
99465.3相关性分析在数据挖掘中的应用 12
19083第六章回归分析 12
104666.1回归分析概述 12
6206.1.1定义与意义 12
106066.1.2回归分析类型 12
246276.2线性回归模型 12
93326.2.1一元线性回归模型 13
67026.2.2多元线性回归模型 13
156136.2.3线性回归模型的估计方法 13
98056.3回归模型评估与优化 13
71906.3.1模型评估指标 13
288656.3.2模型优化方法 13
120656.3.3模型选择与调整 13
25483第七章聚类分析 14
188427.1聚类分析概述 14
224557.2常用聚类算法 14
199567.2.1层次聚类算法 14
95247.2.2划分聚类算法 14
241917.2.3密度聚类算法 15
283287.2.4基于模型的聚类算法 15
241927.3聚类结果评估与应用 15
288527.3.1聚类结果评估 15
32817.3.2聚类应用 15
6273第八章时间序列分析 15
32748.1时间序列概述 16
9138.1.1时间序列的组成要素 16
59628.1.2时间序列的类型 16
233288.2时间序列预测方法 16
74398.2.1移动平均法 16
203858.2.2指数平滑法 16
114538.2.3自回归模型(AR) 16
238388.2.4移动平均模型(MA) 17
16973