数据分析基础作业指导书.doc
数据分析基础作业指导书
TOC\o1-2\h\u14453第1章数据分析概述 3
107781.1数据分析的意义与价值 3
236271.2数据分析的基本流程 3
170371.3数据分析的方法与工具 4
8892第2章数据预处理 4
279032.1数据清洗 4
88842.1.1缺失值处理 4
13532.1.2异常值处理 4
201902.1.3重复值处理 5
268372.1.4数据一致性检查 5
58182.2数据整合 5
148112.2.1数据集成 5
106132.2.2数据合并 5
290252.2.3数据转换 5
123842.3数据规范化 5
241422.3.1最大最小规范化 5
179742.3.2标准差标准化 5
251102.3.3对数变换 5
229402.3.4幂变换 5
327142.4数据离散化与编码 5
236682.4.1等宽离散化 6
144732.4.2等频离散化 6
284152.4.3基于熵的离散化 6
186052.4.4编码方法 6
27877第3章数据可视化 6
130933.1数据可视化基础 6
132073.1.1数据可视化原则 6
135323.1.2数据可视化流程 6
298653.2常见数据可视化图表 6
184643.2.1分类数据可视化图表 7
153813.2.2数值数据可视化图表 7
246683.2.3分布数据可视化图表 7
208723.3Python数据可视化库(Matplotlib和Seaborn) 7
22213.3.1Matplotlib 7
54193.3.2Seaborn 7
9244第4章描述性统计分析 8
152284.1频数分析与图表展示 8
175244.1.1频数分析 8
105524.1.2图表展示 8
299734.2集中趋势分析 8
305754.2.1均值 8
3194.2.2中位数 8
105354.2.3众数 8
147414.3离散程度分析 8
100534.3.1极差 8
69024.3.2四分位差 8
318924.3.3方差与标准差 9
22644.4分布形态分析 9
233254.4.1偏度 9
81414.4.2峰度 9
320494.4.3正态分布 9
2265第5章概率论与数理统计基础 9
183885.1随机变量及其分布 9
155485.2假设检验 9
3615.3方差分析 9
241675.4相关分析与回归分析 10
18123第6章基础预测模型 10
200166.1线性回归模型 10
312996.1.1模型原理 10
254676.1.2模型建立 10
7476.1.3模型评估 10
268806.2逻辑回归模型 10
103766.2.1模型原理 10
60896.2.2模型建立 10
304386.2.3模型评估 11
285786.3决策树模型 11
115606.3.1模型原理 11
326616.3.2模型建立 11
83836.3.3模型评估 11
19516.4随机森林模型 11
309386.4.1模型原理 11
258006.4.2模型建立 11
37246.4.3模型评估 11
836第7章时间序列分析 11
243237.1时间序列概述 11
118437.2平稳时间序列分析 12
103637.3季节性分解 12
50187.4时间序列预测方法 12
20441第8章机器学习基础 12
167558.1机器学习概述 12
235718.2监督学习算法 13
221698.3无监督学习算法 13
322008.4评估与优化机器学习模型 13
8742第9章数据挖掘实践 14
32609.1数据挖掘概述 14
55299.2关联规则挖掘 14
292059.3聚类分析 14
175659.4文本挖掘 14
28034第10章数据分析应用案例 15
184411