文档详情

数据处理与分析方法高级实战培训.doc

发布:2025-03-17约1.77万字共19页下载文档
文本预览下载声明

数据处理与分析方法高级实战培训

TOC\o1-2\h\u14172第一章数据采集与预处理 3

76941.1数据采集方法 3

274201.1.1网络爬虫技术 3

82431.1.2数据接口调用 3

33481.1.3文件导入与导出 3

161761.2数据清洗与去重 3

99981.2.1数据清洗概述 3

316321.2.2数据去重 3

14511.2.3数据填充与插值 4

32371.3数据格式转换 4

49301.3.1数据类型转换 4

190641.3.2数据结构转换 4

109121.3.3文件格式转换 4

1022第二章数据存储与管理 4

104512.1数据库选择与设计 4

31202.1.1数据库选择 4

323742.1.2数据库设计 5

237422.2SQL语言基础 5

174182.2.1数据定义 5

254542.2.2数据查询 5

128932.2.3数据更新 5

305712.3数据库功能优化 6

100172.3.1索引优化 6

243342.3.2查询优化 6

171252.3.3存储优化 6

6732第三章数据可视化 6

258623.1常见数据可视化工具 6

176553.1.1Tableau 7

30623.1.2PowerBI 7

197063.1.3Python数据可视化库 7

103963.1.4R语言 7

224243.2数据可视化设计原则 7

274333.2.1简洁性 7

236393.2.2直观性 7

73833.2.3易读性 7

61893.2.4一致性 7

176323.2.5交互性 7

89823.3动态数据可视化 7

230913.3.1动态图表 8

9093.3.2动态散点图 8

40013.3.3动态地图 8

139353.3.4动态热力图 8

303603.3.5动态时间序列图 8

5970第四章数据统计分析基础 8

216814.1描述性统计分析 8

134114.2假设检验 8

108934.3方差分析 9

12858第五章数据挖掘方法 9

79085.1聚类分析 9

182475.2关联规则挖掘 10

221865.3机器学习算法 10

21453第六章时间序列分析 11

193796.1时间序列的基本概念 11

6406.2时间序列预测方法 12

320756.3时间序列分析软件应用 12

32576第七章数据建模与优化 13

293277.1建模方法概述 13

318847.2线性回归与逻辑回归 13

11647.2.1线性回归 13

178187.2.2逻辑回归 13

221337.3模型评估与优化 14

190107.3.1模型评估 14

216177.3.2模型优化 14

15125第八章文本挖掘与分析 14

55718.1文本预处理 14

162188.1.1文本清洗 15

95728.1.2停用词过滤 15

234958.1.3词性标注 15

31468.1.4词干提取与词形还原 15

61918.2词频统计与TFIDF 15

48378.2.1词频统计 15

90898.2.2TFIDF 15

70768.3主题模型与情感分析 15

288688.3.1主题模型 15

180458.3.2情感分析 16

238008.3.3结合主题模型与情感分析 16

19911第九章大数据分析技术 16

115259.1Hadoop生态系统 16

202119.1.1简介 16

276829.1.2Hadoop分布式文件系统(HDFS) 16

14999.1.3MapReduce 16

139049.1.4YARN 16

306599.1.5其他组件 16

61159.2Spark编程基础 17

131299.2.1简介 17

128529.2.2Spark运行架构 17

135169.2.3Spark核心概念 17

58659.2.4Spark编

显示全部
相似文档