文档详情

数据分析与处理作业指导书.doc

发布:2025-02-16约1.96万字共21页下载文档
文本预览下载声明

数据分析与处理作业指导书

TOC\o1-2\h\u7273第一章数据采集与预处理 3

80911.1数据采集方法 3

173471.1.1网络爬虫采集 4

286681.1.2API接口调用 4

315991.1.3数据库导入 4

230851.1.4手动采集 4

262061.2数据清洗与预处理 4

14031.2.1数据去重 4

261791.2.2数据缺失值处理 4

117771.2.3数据格式统一 4

274491.2.4数据规范化 5

15916第二章数据可视化 5

35032.1数据可视化概述 5

198452.2常用可视化工具介绍 5

114142.2.1Tableau 5

303582.2.2PowerBI 5

230822.2.3PythonMatplotlib 5

177002.2.4R语言 6

296382.2.5ECharts 6

182002.3数据可视化技巧与实践 6

260272.3.1选择合适的图表类型 6

240092.3.2保持图表简洁明了 6

249892.3.3使用合适的颜色搭配 6

67932.3.4注重图表的交互性 6

183672.3.5结合文字说明 6

22072.3.6优化图表布局 7

151392.3.7实践案例分析 7

6171第三章描述性统计分析 7

265863.1描述性统计方法 7

143643.1.1频数分布 7

283003.1.2中心趋势度量 7

257333.1.3离散程度度量 8

189223.2数据分布与趋势分析 8

190053.2.1数据分布分析 8

257073.2.2数据趋势分析 8

323533.3数据异常值检测 8

23543.3.1箱线图法 8

266433.3.2标准差法 9

289623.3.3基于聚类分析的异常值检测 9

14802第四章假设检验与推断性统计分析 9

300384.1假设检验概述 9

323824.2常用假设检验方法 9

313894.2.1单样本t检验 9

80434.2.2双样本t检验 9

14584.2.3卡方检验 10

133694.3结果解释与推断 10

9792第五章相关性分析 10

128765.1相关性概念与度量 10

58725.2相关系数计算与应用 11

2785.2.1皮尔逊相关系数 11

89895.2.2斯皮尔曼秩相关系数 11

249745.2.3肯德尔秩相关系数 11

99465.3相关性分析在数据挖掘中的应用 12

19083第六章回归分析 12

104666.1回归分析概述 12

6206.1.1定义与意义 12

106066.1.2回归分析类型 12

246276.2线性回归模型 12

93326.2.1一元线性回归模型 13

67026.2.2多元线性回归模型 13

156136.2.3线性回归模型的估计方法 13

98056.3回归模型评估与优化 13

71906.3.1模型评估指标 13

288656.3.2模型优化方法 13

120656.3.3模型选择与调整 13

25483第七章聚类分析 14

188427.1聚类分析概述 14

224557.2常用聚类算法 14

199567.2.1层次聚类算法 14

95247.2.2划分聚类算法 14

241917.2.3密度聚类算法 15

283287.2.4基于模型的聚类算法 15

241927.3聚类结果评估与应用 15

288527.3.1聚类结果评估 15

32817.3.2聚类应用 15

6273第八章时间序列分析 15

32748.1时间序列概述 16

9138.1.1时间序列的组成要素 16

59628.1.2时间序列的类型 16

233288.2时间序列预测方法 16

74398.2.1移动平均法 16

203858.2.2指数平滑法 16

114538.2.3自回归模型(AR) 16

238388.2.4移动平均模型(MA) 17

16973

显示全部
相似文档