数据科学与大数据处理作业指导书.doc
数据科学与大数据处理作业指导书
TOC\o1-2\h\u10569第一章数据科学基础 3
241431.1数据科学的定义与范畴 3
262191.2数据科学的核心技术 3
162551.3数据科学的应用领域 4
27448第二章数据采集与预处理 4
249922.1数据采集方法 4
303082.1.1网络爬虫 4
251092.1.2数据接口 4
110672.1.3文件导入 5
195962.1.4数据库连接 5
199682.2数据清洗与转换 5
180162.2.1数据清洗 5
82492.2.2数据转换 5
241112.3数据预处理策略 5
175322.3.1数据集成 5
268762.3.2特征选择 5
34422.3.3特征转换 6
249882.3.4数据降维 6
312792.3.5数据平滑 6
9270第三章数据可视化与分析 6
292003.1数据可视化工具与技术 6
284493.1.1数据可视化工具 6
94053.1.2数据可视化技术 6
70223.2数据分析方法 7
222713.2.1描述性统计分析 7
211973.2.2假设检验 7
275343.2.3相关性分析 7
301443.2.4回归分析 7
120313.3数据挖掘与知识发觉 7
154083.3.1数据挖掘方法 7
267503.3.2知识发觉应用 8
11235第四章统计学习与机器学习 8
319924.1统计学习方法 8
70104.2机器学习算法 8
84064.3模型评估与优化 9
27984第五章大数据处理技术 9
134535.1分布式存储与计算 9
202955.1.1分布式存储概述 9
26845.1.2分布式存储技术 9
247435.1.3分布式计算概述 9
22915.1.4分布式计算技术 10
23205.2大数据计算框架 10
290305.2.1大数据计算框架概述 10
172315.2.2常见大数据计算框架 10
76845.2.3大数据计算框架功能比较 10
23095.3大数据应用案例分析 10
208205.3.1案例一:搜索引擎 10
113575.3.2案例二:社交网络分析 10
203675.3.3案例三:金融风险监控 10
62745.3.4案例四:智能医疗 10
30655第六章数据仓库与数据湖 10
303926.1数据仓库的概念与架构 10
7556.1.1数据仓库的概念 11
259206.1.2数据仓库的架构 11
5246.2数据湖的设计与实现 11
57546.2.1数据湖的概念 11
140606.2.2数据湖的设计 11
86626.2.3数据湖的实现 12
30786.3数据仓库与数据湖的融合 12
23961第七章数据挖掘与知识发觉 12
178367.1数据挖掘任务与方法 12
39687.2关联规则挖掘 13
88437.3聚类分析与分类预测 13
29638第八章深度学习与神经网络 14
33748.1深度学习基础 14
217908.1.1深度学习的概念与原理 14
201018.1.2深度学习的数学基础 14
14298.1.3深度学习框架简介 14
291278.2神经网络模型 14
183048.2.1神经元模型 14
194858.2.2前馈神经网络 15
283838.2.3卷积神经网络 15
284148.2.4循环神经网络 15
17608.3深度学习应用案例 15
169398.3.1图像识别 15
257018.3.2自然语言处理 15
109098.3.3语音识别 15
55528.3.4推荐系统 15
35688.3.5其他应用领域 15
247579.1数据安全策略 15
158809.2隐私保护技术 16
196079.3数据安全与隐私保护案例分析 16
30471第十章数据科学与大数据处理展望 17
2261010.1数据科学的发展趋势 17
10702