文档详情

数据挖掘与信息管理实战教程.doc

发布:2025-04-05约1.58万字共19页下载文档
文本预览下载声明

数据挖掘与信息管理实战教程

TOC\o1-2\h\u8231第一章数据挖掘基础 2

71941.1数据挖掘概述 2

72781.2数据挖掘流程 3

29751.2.1业务理解 3

182911.2.2数据准备 3

107371.2.3模型建立 3

271251.2.4模型评估 3

141121.2.5部署与应用 3

73991.3数据挖掘常用算法 4

258391.3.1决策树算法 4

156641.3.2支持向量机算法 4

35961.3.3人工神经网络算法 4

37221.3.4K均值聚类算法 4

297061.3.5关联规则挖掘算法 4

3600第二章数据预处理 4

87362.1数据清洗 4

149682.1.1识别错误数据 5

171542.1.2处理缺失值 5

18242.1.3处理重复数据 5

272062.1.4修正错误数据 5

62092.2数据集成 5

56892.2.1数据源识别 5

66692.2.2数据抽取 5

53882.2.3数据转换 5

208762.2.4数据加载 5

42922.3数据变换 6

157172.3.1特征选择 6

244042.3.2特征抽取 6

35842.3.3特征降维 6

247702.4数据归一化与标准化 6

142392.4.1数据归一化 6

172292.4.2数据标准化 6

13924第三章数据仓库技术 6

15163.1数据仓库概念与结构 6

70043.2数据仓库设计 7

50263.3数据仓库实施与管理 7

294443.4数据仓库的功能优化 8

26222第四章关联规则挖掘 8

227644.1关联规则基本概念 8

222574.2Apriori算法 8

269674.3FPgrowth算法 9

97184.4关联规则的应用 9

2324第五章聚类分析 9

305905.1聚类分析概述 10

319685.2Kmeans算法 10

294505.3层次聚类算法 10

217745.4密度聚类算法 11

6953第六章分类与预测 11

59706.1分类与预测概述 11

160306.2决策树算法 11

81466.3支持向量机算法 11

142376.4朴素贝叶斯算法 12

15351第七章时间序列分析 12

45827.1时间序列基本概念 12

216527.2时间序列分析方法 13

140277.3时间序列预测模型 13

272187.4时间序列数据挖掘应用 13

30313第八章文本挖掘 14

323988.1文本挖掘概述 14

162798.2文本预处理 14

51248.3词频逆文档频率(TFIDF) 14

93038.4文本分类与聚类 15

3583第九章信息管理策略 15

304169.1信息管理概述 15

107329.2信息采集与存储 15

274209.2.1信息采集 15

282769.2.2信息存储 15

195589.3信息检索与发布 16

11709.3.1信息检索 16

21019.3.2信息发布 16

210629.4信息安全管理 16

104559.4.1信息安全概述 16

112069.4.2信息安全策略 16

246429.4.3信息安全风险防范 16

22372第十章数据挖掘与信息管理实战案例 17

381910.1电商用户行为分析 17

1677210.2金融风险预测 17

2006110.3社交网络分析 18

2696210.4健康医疗数据挖掘 18

第一章数据挖掘基础

1.1数据挖掘概述

数据挖掘(DataMining)是指从大量数据集中提取出潜在的、未知的、有价值的信息和知识的过程。互联网和大数据技术的迅速发展,数据挖掘已成为信息时代的一项重要技术。数据挖掘技术涉及统计学、机器学习、数据库、人工智能等多个领域,广泛应用于商业决策、市场分析、生物信息学、金融投资等领域。

数据挖掘的目标是从大量数据中找出隐藏的、有用的信息和知识,以便为决策者提供支持。数据挖掘的主要任务包括关联规

显示全部
相似文档