数据处理与分析作业指导书.doc
数据处理与分析作业指导书
TOC\o1-2\h\u30299第1章数据处理基础 4
206981.1数据类型与数据结构 4
144671.1.1数据类型 4
99921.1.2数据结构 4
26061.2数据清洗与预处理 4
140891.2.1缺失值处理 4
179821.2.2异常值处理 4
197791.2.3数据规范化 5
308461.3数据整合与转换 5
233871.3.1数据整合 5
216991.3.2数据转换 5
21373第2章数据分析方法论 5
255162.1描述性统计分析 5
262362.2假设检验与推断统计 5
313962.3数据挖掘与机器学习 6
1112第3章数据可视化 6
2263.1基本图表与图形 6
147803.1.1柱状图 6
208563.1.2折线图 6
67453.1.3饼图 6
191113.2高级可视化技术 6
100743.2.1散点图 7
238323.2.2热力图 7
231113.2.3雷达图 7
168173.3交互式数据可视化 7
33.3.1交互式柱状图 7
294553.3.2交互式散点图 7
114763.3.3可视化仪表盘 7
12282第4章数据存储与管理 7
65504.1关系型数据库 7
138994.1.1关系型数据库的原理 7
316164.1.2常见关系型数据库 8
87264.1.3关系型数据库的优势 8
130984.1.4关系型数据库的局限 8
315134.2非关系型数据库 8
216894.2.1非关系型数据库的分类 8
27554.2.2非关系型数据库的优势 8
231224.2.3非关系型数据库的局限 9
100644.3分布式文件系统 9
69834.3.1分布式文件系统的原理 9
176024.3.2常见分布式文件系统 9
137284.3.3分布式文件系统的优势 9
252914.3.4分布式文件系统的局限 9
17639第5章数据挖掘算法 9
263415.1分类算法 9
226315.1.1概述 10
112935.1.2常见分类算法 10
277025.2聚类算法 10
77865.2.1概述 10
9655.2.2常见聚类算法 10
96015.3关联规则挖掘 10
148015.3.1概述 10
9035.3.2常见关联规则挖掘算法 11
30945第6章机器学习实战 11
117926.1监督学习 11
268116.1.1数据准备 11
72386.1.2模型选择与训练 11
164986.1.3模型评估 11
69676.1.4模型优化 11
271356.2无监督学习 12
4036.2.1数据准备 12
29456.2.2模型选择与训练 12
98316.2.3模型评估 12
275426.2.4模型优化 12
231876.3强化学习 12
44636.3.1强化学习基础 12
253586.3.2模型建立 12
180586.3.3强化学习算法 12
87606.3.4强化学习应用 13
3897第7章时间序列分析 13
206797.1时间序列基本概念 13
62367.1.1时间序列定义 13
274117.1.2时间序列要素 13
194517.1.3时间序列分类 13
240137.2时间序列预测方法 13
29807.2.1描述性预测方法 13
54817.2.2模型预测方法 14
180997.3时间序列模型评估 14
280867.3.1模型评估指标 14
51117.3.2模型选择与优化 14
111447.3.3模型应用与监控 14
29000第8章文本分析与自然语言处理 14
144308.1文本预处理 14
84618.1.1分词 14
226198.1.2词性标注 14
73718.1.3去停用词 15
54098.1.4数据清洗 15
33638.2词向量与词嵌入 15