大数据分析实践作业指导书.doc
大数据分析实践作业指导书
TOC\o1-2\h\u32688第一章数据采集与预处理 3
43911.1数据来源及采集方法 3
154561.1.1数据来源 3
164591.1.2数据采集方法 4
303311.2数据清洗与格式化 4
220221.2.1数据清洗 4
64641.2.2数据格式化 4
12657第二章数据存储与管理 5
278892.1数据库选择与设计 5
289672.2数据导入与导出 5
142312.3数据库功能优化 6
17788第三章数据可视化 6
104653.1数据可视化工具介绍 6
13843.1.1Tableau 6
45733.1.2PowerBI 6
91713.1.3Python可视化库 6
121923.1.4ECharts 7
205103.2数据可视化方法与技巧 7
184623.2.1选择合适的图表类型 7
92513.2.2合理布局 7
47913.2.3注重颜色搭配 7
48633.2.4交互式操作 7
292613.3交互式数据可视化 7
100823.3.1数据筛选 8
299133.3.2数据提示 8
218243.3.3动态更新 8
278663.3.4图表缩放与滚动 8
526第四章数据挖掘与分析 8
233204.1数据挖掘算法介绍 8
163784.2数据挖掘案例分析 9
213824.3结果评估与优化 9
23478第五章机器学习应用 10
77685.1机器学习基本概念 10
66105.1.1定义及分类 10
77995.1.2监督学习 10
101725.1.3无监督学习 10
43555.1.4半监督学习 10
96895.1.5增强学习 10
55115.2机器学习算法实践 10
70015.2.1线性回归 10
115185.2.2逻辑回归 10
270575.2.3决策树 10
35545.2.4支持向量机 11
176335.2.5神经网络 11
240285.3模型评估与调整 11
79225.3.1评估指标 11
96805.3.2交叉验证 11
103135.3.3超参数调整 11
151865.3.4模型优化 11
21451第六章深度学习应用 11
293916.1深度学习基本概念 11
12546.1.1定义及发展历程 11
184116.1.2主要技术原理 11
324936.2卷积神经网络应用 12
219896.2.1卷积神经网络概述 12
103596.2.2应用场景 12
20456.3循环神经网络应用 12
27246.3.1循环神经网络概述 12
271886.3.2应用场景 12
29542第七章自然语言处理 13
12447.1自然语言处理基础 13
69837.1.1概述 13
168477.1.2发展历程 13
292597.1.3基本任务 13
41737.2词向量与文本表示 13
53317.2.1词向量 13
258047.2.2文本表示 13
124667.3文本分类与情感分析 13
236147.3.1文本分类 13
180757.3.2情感分析 14
105267.3.3应用案例 14
15028第八章推荐系统 14
198438.1推荐系统概述 14
96228.2协同过滤算法 14
302868.3深度学习在推荐系统中的应用 15
6660第九章大数据分析平台与工具 15
192529.1大数据技术栈介绍 15
22649.1.1数据存储与处理 16
106869.1.2数据分析与挖掘 16
44229.1.3数据可视化与展示 16
135549.2大数据分析平台搭建 16
205639.2.1平台架构设计 16
275059.2.2技术选型与集成 16
43599.2.3平台部署与运维 17
162299.3大数据分析工具应用 17
28459.3.1ApacheSpark 17
181589.3.2