数据挖掘与信息管理实战教程.doc
数据挖掘与信息管理实战教程
TOC\o1-2\h\u8231第一章数据挖掘基础 2
71941.1数据挖掘概述 2
72781.2数据挖掘流程 3
29751.2.1业务理解 3
182911.2.2数据准备 3
107371.2.3模型建立 3
271251.2.4模型评估 3
141121.2.5部署与应用 3
73991.3数据挖掘常用算法 4
258391.3.1决策树算法 4
156641.3.2支持向量机算法 4
35961.3.3人工神经网络算法 4
37221.3.4K均值聚类算法 4
297061.3.5关联规则挖掘算法 4
3600第二章数据预处理 4
87362.1数据清洗 4
149682.1.1识别错误数据 5
171542.1.2处理缺失值 5
18242.1.3处理重复数据 5
272062.1.4修正错误数据 5
62092.2数据集成 5
56892.2.1数据源识别 5
66692.2.2数据抽取 5
53882.2.3数据转换 5
208762.2.4数据加载 5
42922.3数据变换 6
157172.3.1特征选择 6
244042.3.2特征抽取 6
35842.3.3特征降维 6
247702.4数据归一化与标准化 6
142392.4.1数据归一化 6
172292.4.2数据标准化 6
13924第三章数据仓库技术 6
15163.1数据仓库概念与结构 6
70043.2数据仓库设计 7
50263.3数据仓库实施与管理 7
294443.4数据仓库的功能优化 8
26222第四章关联规则挖掘 8
227644.1关联规则基本概念 8
222574.2Apriori算法 8
269674.3FPgrowth算法 9
97184.4关联规则的应用 9
2324第五章聚类分析 9
305905.1聚类分析概述 10
319685.2Kmeans算法 10
294505.3层次聚类算法 10
217745.4密度聚类算法 11
6953第六章分类与预测 11
59706.1分类与预测概述 11
160306.2决策树算法 11
81466.3支持向量机算法 11
142376.4朴素贝叶斯算法 12
15351第七章时间序列分析 12
45827.1时间序列基本概念 12
216527.2时间序列分析方法 13
140277.3时间序列预测模型 13
272187.4时间序列数据挖掘应用 13
30313第八章文本挖掘 14
323988.1文本挖掘概述 14
162798.2文本预处理 14
51248.3词频逆文档频率(TFIDF) 14
93038.4文本分类与聚类 15
3583第九章信息管理策略 15
304169.1信息管理概述 15
107329.2信息采集与存储 15
274209.2.1信息采集 15
282769.2.2信息存储 15
195589.3信息检索与发布 16
11709.3.1信息检索 16
21019.3.2信息发布 16
210629.4信息安全管理 16
104559.4.1信息安全概述 16
112069.4.2信息安全策略 16
246429.4.3信息安全风险防范 16
22372第十章数据挖掘与信息管理实战案例 17
381910.1电商用户行为分析 17
1677210.2金融风险预测 17
2006110.3社交网络分析 18
2696210.4健康医疗数据挖掘 18
第一章数据挖掘基础
1.1数据挖掘概述
数据挖掘(DataMining)是指从大量数据集中提取出潜在的、未知的、有价值的信息和知识的过程。互联网和大数据技术的迅速发展,数据挖掘已成为信息时代的一项重要技术。数据挖掘技术涉及统计学、机器学习、数据库、人工智能等多个领域,广泛应用于商业决策、市场分析、生物信息学、金融投资等领域。
数据挖掘的目标是从大量数据中找出隐藏的、有用的信息和知识,以便为决策者提供支持。数据挖掘的主要任务包括关联规