数据挖掘与信息检索指南.doc
数据挖掘与信息检索指南
TOC\o1-2\h\u10128第一章数据挖掘基础 3
83501.1数据挖掘概述 3
294071.2数据挖掘流程 3
162671.3数据挖掘任务与算法 3
23595第二章数据预处理 4
224152.1数据清洗 4
97392.2数据集成 4
69892.3数据转换 5
290162.4数据归一化与标准化 5
15262.4.1数据归一化 5
69912.4.2数据标准化 5
23388第三章数据挖掘算法 6
281233.1分类算法 6
14293.2聚类算法 6
151523.3关联规则挖掘 7
93983.4序列模式挖掘 7
1807第四章信息检索基础 7
24174.1信息检索概述 7
131734.2信息检索模型 8
229394.3信息检索评价标准 8
49984.4信息检索系统架构 8
21986第五章文本预处理 9
79115.1文本清洗 9
128625.2词性标注 9
43365.3停用词处理 9
161025.4词干提取与词形还原 10
23126第六章文本挖掘 10
199056.1文本分类 10
167026.1.1文本分类方法 10
247626.1.2文本分类的评价指标 11
109726.2文本聚类 11
203206.2.1文本聚类方法 11
89676.2.2文本聚类的评价指标 11
180926.3情感分析 11
65026.3.1情感分析方法 11
235336.3.2情感分析的评价指标 12
187306.4主题模型 12
297396.4.1主题模型方法 12
100956.4.2主题模型的应用 12
2940第七章信息检索算法 12
219417.1布尔模型 12
10567.1.1布尔表达式的组成 13
166557.1.2布尔模型的评估方法 13
90557.2向量空间模型 13
71737.2.1向量的构建 13
211217.2.2相似度计算 13
41497.3概率模型 13
113497.3.1概率模型的组成 13
118237.3.2概率模型的评估方法 13
256347.4深度学习模型 13
54247.4.1神经网络基础 14
145907.4.2深度学习模型在信息检索中的应用 14
229437.4.3深度学习模型的训练与优化 14
207第八章信息检索应用 14
103578.1搜索引擎 14
288188.1.1概述 14
222718.1.2网页抓取 14
132098.1.3索引构建 14
188448.1.4查询处理 14
127558.1.5排序算法 15
126358.2推荐系统 15
95818.2.1概述 15
244918.2.2推荐算法 15
251528.2.3评估指标 15
103708.3社交网络分析 15
15158.3.1概述 15
201198.3.2用户行为分析 15
157568.3.3社交网络结构分析 15
47838.3.4情感分析 16
303248.4生物信息学 16
15448.4.1概述 16
146708.4.2序列分析 16
3608.4.3结构分析 16
111418.4.4功能分析 16
27997第九章数据挖掘与信息检索融合 16
207309.1数据挖掘与信息检索的结合 16
116879.2融合算法与应用 16
144049.3融合发展趋势 17
207209.4案例分析 17
19984第十章数据挖掘与信息检索工具与平台 18
2847210.1数据挖掘工具 18
1442510.2信息检索工具 18
1346710.3开源平台与框架 18
2472310.4工具与平台的选择与应用 19
第一章数据挖掘基础
1.1数据挖掘概述
数据挖掘(DataMining)是指从大量数据中通过算法和统计分析方法,发觉潜在的、有价值的信息和知识的过程。信息技术的飞速发展,数据挖掘已成为人工智能、统计学和计算