文档详情

数据分析和挖掘作业指导书.doc

发布:2025-03-07约1.76万字共20页下载文档
文本预览下载声明

数据分析和挖掘作业指导书

TOC\o1-2\h\u11657第一章数据分析概述 3

137271.1数据分析的基本概念 3

244251.2数据分析的发展历程 3

221041.3数据分析的主要应用领域 4

9559第二章数据采集与预处理 4

109862.1数据采集方法 4

227052.2数据清洗与整理 5

44252.3数据转换与集成 5

269832.4数据质量评估 6

17485第三章描述性统计分析 6

38523.1数据分布分析 6

196913.1.1数据分布概述 6

265393.1.2集中趋势分析 6

200373.1.3离散程度分析 6

66783.1.4偏态分布分析 6

28733.2数据可视化 7

327033.2.1可视化方法选择 7

146713.2.2柱状图和折线图 7

149513.2.3散点图和箱线图 7

51793.3数据特征分析 7

317733.3.1数据特征概述 7

323333.3.2数据类型分析 7

154633.3.3数据分布特征分析 7

75593.4数据相关性分析 7

111523.4.1相关性概述 7

87483.4.2皮尔逊相关系数 8

320993.4.3斯皮尔曼等级相关系数 8

28243.4.4肯德尔等级相关系数 8

12011第四章数据挖掘基础 8

73644.1数据挖掘的概念与任务 8

181454.2数据挖掘的方法与技术 8

115184.3数据挖掘过程 9

202184.4数据挖掘工具与软件 9

9983第五章分类与预测 9

297455.1分类方法概述 9

80065.2常见分类算法 10

283455.3预测模型构建 10

133745.4模型评估与优化 10

5701第六章聚类分析 11

117406.1聚类分析概述 11

281006.2常见聚类算法 11

69046.2.1Kmeans算法 11

24996.2.2层次聚类算法 11

252466.2.3密度聚类算法 12

38556.3聚类结果评估 12

124526.3.1轮廓系数 12

131436.3.2同质性 12

82746.3.3完整性 12

142956.4聚类分析的实践应用 12

237706.4.1市场细分 12

220946.4.2图像分割 12

283956.4.3文本分类 13

68726.4.4生物学研究 13

26549第七章关联规则挖掘 13

146897.1关联规则的基本概念 13

238167.1.1支持度 13

91537.1.2置信度 13

19157.1.3提升度 13

35347.2关联规则挖掘算法 13

68467.2.1Apriori算法 13

140537.2.2FPgrowth算法 14

290567.3关联规则的应用 14

196307.4关联规则的评估与优化 14

126957.4.1支持度阈值调整 14

64517.4.2置信度阈值调整 14

292557.4.3提升度阈值调整 15

323867.4.4基于约束的关联规则挖掘 15

32218第八章序列模式挖掘 15

52248.1序列模式挖掘概述 15

207158.2序列模式挖掘算法 15

84638.2.1基于Apriori算法的序列模式挖掘算法 15

197258.2.2基于关联规则的序列模式挖掘算法 16

111398.3序列模式的应用 16

4458.4序列模式的评估与优化 16

8044第九章网络数据分析 16

178499.1网络数据的基本概念 17

295619.1.1定义与分类 17

276959.1.2特点与挑战 17

41859.2网络数据分析方法 17

318539.2.1文本分析方法 17

256439.2.2关联规则挖掘 17

184179.2.3社区发觉 18

119869.2.4聚类分析 18

230459.3网络数据挖掘应用 18

137179.3.1网络舆情分析 18

2184

显示全部
相似文档