基于软件学习数据挖掘算法与案例.pdf
文本预览下载声明
技术成就梦想
基于软件学习数据挖掘算法与案例
数据挖掘背景介绍:
数据挖掘是近几年来一个在IT 领域非常活跃的实用性技术学科,由于其广泛的应用,极为
出彩的实际应用效果,对于各行业几乎都可以无门槛地进行分析和挖掘部署,受到了越来越
多的关注。数据挖掘是一门综合学科,它包括了数据库技术、统计学、信息科学、机器学习、
可视化、以及其他学科的部分内容。
在互联网行业大行其道的今天,越来越多的传统行业受到了冲击,而在这一切竞争的背后,
数据都被认为是能够战胜对手使企业脱颖而出的利器,从数据中学习知识已经是众多大型企
业的共识,而在各行业中的领头羊企业的数据挖掘水平也常被称道,如阿里巴巴的大数据挖
掘,百度的深度学习等等
数据挖掘工程师作为一个职业,有着非常好的前景和巨大的职位缺口,有志向职位发展的同
学急不可急于求成,要扎实地打好基础,学习数据挖掘算法,有一定的行业知识了解,清楚
各行业分析过程中更为看重的目标是什么。
本次数据挖掘课程作为提升级别,通过较为具体、丰富的案例来为学员们带来数据挖掘具体
项目的应用感受, 而最为关键的一点是在本次学习过程中我们将对一些特别重要但是又比
较稀缺的行业知识和算法进行梳理,例如图像挖掘入门,生物/化学等行业
课程大纲:
第一课 数据挖掘算法体系与常用挖掘软件
第二课 K-NN 算法与建立模型
第三课 朴素贝叶斯算法与交叉验证
第四课 零售行业的客户挖掘
第五课 教育行业的关联推荐算法
第六课 医疗主题的聚类算法学习
第七课 文本挖掘:垃圾邮件检测
第八课 文本挖掘:语言识别与客户反馈分析
第九课 基于天体物理学和医疗行业的特征选择和分类学习
第十课 基于生物医疗行业的建模学习
第十一课 异常检测和实例选择
第十二课 元建模学习和特征选择以及参数优化
@ DataGuru 专业数据分析社区 网址 :edu.dataguru.cn 1
技术成就梦想
授课对象:
对于数据挖掘感兴趣,喜欢用数据来思考问题,相信正确地处理数据能够反映问题的实质,
对于常用挖掘算法学习较快,希望能够拓展自己算法知识的同学,会数据挖掘工具更佳。
课程基础:
以下内容至少会一种,数据库知识、统计学、信息科学、机器学习。如果现在不会,可以通
过网络先简单学习一下统计学基础知识。
软件要求:
Rapidminer (sourceforge 下载)/oracle/Python 等
注:软件暂时不会不要紧,十分容易入门,同学们一定会喜欢这款挖掘工具(rapidminer)
讲师介绍:
宫艳琢,毕业于吉林大学商学院数量经济学专业,本科主修数学与应用数学。现就职于平安
银行,任大数据分析岗,主要职务是在银行数据库中为各业务线条寻找目标客户,建立模型
以及模板化数据挖掘需求。
有多年电信/互联网/保险/银行/零售行业的数据挖掘项目经验,对数据挖掘常用算法较为熟
悉,关注数据挖掘应用方向的最新算法。对数据处理和特征提取有自己的经验和套路,并且
能够灵活应用,用通俗易懂的方式与别人分享。
@ DataGuru 专业数据分析社区 网址 :edu.dataguru.cn 2
显示全部