数据分析和挖掘作业指导书.doc
数据分析和挖掘作业指导书
TOC\o1-2\h\u11657第一章数据分析概述 3
137271.1数据分析的基本概念 3
244251.2数据分析的发展历程 3
221041.3数据分析的主要应用领域 4
9559第二章数据采集与预处理 4
109862.1数据采集方法 4
227052.2数据清洗与整理 5
44252.3数据转换与集成 5
269832.4数据质量评估 6
17485第三章描述性统计分析 6
38523.1数据分布分析 6
196913.1.1数据分布概述 6
265393.1.2集中趋势分析 6
200373.1.3离散程度分析 6
66783.1.4偏态分布分析 6
28733.2数据可视化 7
327033.2.1可视化方法选择 7
146713.2.2柱状图和折线图 7
149513.2.3散点图和箱线图 7
51793.3数据特征分析 7
317733.3.1数据特征概述 7
323333.3.2数据类型分析 7
154633.3.3数据分布特征分析 7
75593.4数据相关性分析 7
111523.4.1相关性概述 7
87483.4.2皮尔逊相关系数 8
320993.4.3斯皮尔曼等级相关系数 8
28243.4.4肯德尔等级相关系数 8
12011第四章数据挖掘基础 8
73644.1数据挖掘的概念与任务 8
181454.2数据挖掘的方法与技术 8
115184.3数据挖掘过程 9
202184.4数据挖掘工具与软件 9
9983第五章分类与预测 9
297455.1分类方法概述 9
80065.2常见分类算法 10
283455.3预测模型构建 10
133745.4模型评估与优化 10
5701第六章聚类分析 11
117406.1聚类分析概述 11
281006.2常见聚类算法 11
69046.2.1Kmeans算法 11
24996.2.2层次聚类算法 11
252466.2.3密度聚类算法 12
38556.3聚类结果评估 12
124526.3.1轮廓系数 12
131436.3.2同质性 12
82746.3.3完整性 12
142956.4聚类分析的实践应用 12
237706.4.1市场细分 12
220946.4.2图像分割 12
283956.4.3文本分类 13
68726.4.4生物学研究 13
26549第七章关联规则挖掘 13
146897.1关联规则的基本概念 13
238167.1.1支持度 13
91537.1.2置信度 13
19157.1.3提升度 13
35347.2关联规则挖掘算法 13
68467.2.1Apriori算法 13
140537.2.2FPgrowth算法 14
290567.3关联规则的应用 14
196307.4关联规则的评估与优化 14
126957.4.1支持度阈值调整 14
64517.4.2置信度阈值调整 14
292557.4.3提升度阈值调整 15
323867.4.4基于约束的关联规则挖掘 15
32218第八章序列模式挖掘 15
52248.1序列模式挖掘概述 15
207158.2序列模式挖掘算法 15
84638.2.1基于Apriori算法的序列模式挖掘算法 15
197258.2.2基于关联规则的序列模式挖掘算法 16
111398.3序列模式的应用 16
4458.4序列模式的评估与优化 16
8044第九章网络数据分析 16
178499.1网络数据的基本概念 17
295619.1.1定义与分类 17
276959.1.2特点与挑战 17
41859.2网络数据分析方法 17
318539.2.1文本分析方法 17
256439.2.2关联规则挖掘 17
184179.2.3社区发觉 18
119869.2.4聚类分析 18
230459.3网络数据挖掘应用 18
137179.3.1网络舆情分析 18
2184