数据处理与分析方法高级实战培训.doc
数据处理与分析方法高级实战培训
TOC\o1-2\h\u14172第一章数据采集与预处理 3
76941.1数据采集方法 3
274201.1.1网络爬虫技术 3
82431.1.2数据接口调用 3
33481.1.3文件导入与导出 3
161761.2数据清洗与去重 3
99981.2.1数据清洗概述 3
316321.2.2数据去重 3
14511.2.3数据填充与插值 4
32371.3数据格式转换 4
49301.3.1数据类型转换 4
190641.3.2数据结构转换 4
109121.3.3文件格式转换 4
1022第二章数据存储与管理 4
104512.1数据库选择与设计 4
31202.1.1数据库选择 4
323742.1.2数据库设计 5
237422.2SQL语言基础 5
174182.2.1数据定义 5
254542.2.2数据查询 5
128932.2.3数据更新 5
305712.3数据库功能优化 6
100172.3.1索引优化 6
243342.3.2查询优化 6
171252.3.3存储优化 6
6732第三章数据可视化 6
258623.1常见数据可视化工具 6
176553.1.1Tableau 7
30623.1.2PowerBI 7
197063.1.3Python数据可视化库 7
103963.1.4R语言 7
224243.2数据可视化设计原则 7
274333.2.1简洁性 7
236393.2.2直观性 7
73833.2.3易读性 7
61893.2.4一致性 7
176323.2.5交互性 7
89823.3动态数据可视化 7
230913.3.1动态图表 8
9093.3.2动态散点图 8
40013.3.3动态地图 8
139353.3.4动态热力图 8
303603.3.5动态时间序列图 8
5970第四章数据统计分析基础 8
216814.1描述性统计分析 8
134114.2假设检验 8
108934.3方差分析 9
12858第五章数据挖掘方法 9
79085.1聚类分析 9
182475.2关联规则挖掘 10
221865.3机器学习算法 10
21453第六章时间序列分析 11
193796.1时间序列的基本概念 11
6406.2时间序列预测方法 12
320756.3时间序列分析软件应用 12
32576第七章数据建模与优化 13
293277.1建模方法概述 13
318847.2线性回归与逻辑回归 13
11647.2.1线性回归 13
178187.2.2逻辑回归 13
221337.3模型评估与优化 14
190107.3.1模型评估 14
216177.3.2模型优化 14
15125第八章文本挖掘与分析 14
55718.1文本预处理 14
162188.1.1文本清洗 15
95728.1.2停用词过滤 15
234958.1.3词性标注 15
31468.1.4词干提取与词形还原 15
61918.2词频统计与TFIDF 15
48378.2.1词频统计 15
90898.2.2TFIDF 15
70768.3主题模型与情感分析 15
288688.3.1主题模型 15
180458.3.2情感分析 16
238008.3.3结合主题模型与情感分析 16
19911第九章大数据分析技术 16
115259.1Hadoop生态系统 16
202119.1.1简介 16
276829.1.2Hadoop分布式文件系统(HDFS) 16
14999.1.3MapReduce 16
139049.1.4YARN 16
306599.1.5其他组件 16
61159.2Spark编程基础 17
131299.2.1简介 17
128529.2.2Spark运行架构 17
135169.2.3Spark核心概念 17
58659.2.4Spark编