(精)人工智能之机器学习.ppt
文本预览下载声明
第七讲机器学习 内容提要: 研究意义与发展历史 主要策略与基本结构 几种常用的机器学习方法 知识发现 机器学习的定义和发展历史 机器学习的定义 机器学习 机器学习是研究如何使用机器来模拟人类学习活动的一门学科。 稍为严格的提法是:机器学习 机器学习是一门研究机器获取新知识和新技能,并识别现有知识 的学问。 机器学习的发展分为四个时期 第一阶段是在 第一阶段是在50 年代中叶到 60年代中叶,属于热烈时期。 第二阶段在 60年代中叶至 70年代中叶,被称为机器学习的 冷静时期。 第三阶段从 70年代中叶至 80年代中叶,称为复兴时期 。 1986 年之后,机器学习的研究进入理性的发展时期。 机器学习的目前状况 机器学习进入新阶段的表现 机器学习已成为新的边缘学科并在高校形成课程。 综合各种学习方法 机器学习与人工智能问题的统一性观点正在形成。 各种学习方法的应用范围不断扩大。 数据挖掘和知识发现的研究已形成热潮 。 与机器学习有关的学术活动空前活跃 。 主要策略和基本结构 机器学习的主要策略 按照学习中使用推理的多少,机器学习所采用的策略大体上可分为四种 机械学习 传授学习策略 类比学习系统 通过事例学习策略 学习系统的基本结构 影响学习系统设计的要素 首要因素 影响学习系统设计的最重要因素是环境向系统提供的信息,或者更具体地说是信息的质量。 次要因素 知识库是影响学习系统设计的第二个因素。 知识的表示主要有以下几种形式: ?? 特征向量 一阶逻辑语句 ???? 产生式规则???? 语义网络和框架 机械学习 机械学习模式 机械学习是机器学习是最简单的学习方法。 机械学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理。它是一种最基本的学习过程。 Lenat ,Hayes-Roth ,和Klahr 等人于1979年关于机械学习提出一种有趣的观点。 机械学习的主要问题 存储组织信息 要采用适当的存储方式,使检索速度尽可能地快。 环境的稳定性与存储信息的适用性问题 机械学习系统必须保证所保存的信息适应于外界环境变化的需要。 存储与计算之间的权衡 对于机械学习来说很重要的一点是它不能降低系统的效率。 归纳学习 Induction Learning 类比学习 Learning by Analogy 类比推理和类比学习方式 类比学习就是通过类比,即通过对相似事物加以比较所进行的一种学习 。 其推理过程如下 : 回忆与联想--- 选择 --- 建立对应关系 --- 转换 类比学习过程与研究类型 类比学习主要包括如下四个过程: 1.输入一组已知条件和一组未完全确定的条件 。 2.对两组出入条件寻找其可类比的对应关系。 3.根据相似转换的方法,进行映射。 4.对类推得到的知识进行校验。 类比学习的研究可分为两大类: 1.问题求解型的类比学习 2.预测推定型的类比学习。 两种方式:一是传统的类比法;另一是因果关系型的类比 解释学习 解释学习过程和算法?? 1986年米切尔(Mitchell)等人为基于解释的学习提出了一个统一的算法EBG(基于解释的泛化)。?? 该算法建立了基于解释的概括过程,并运用知识逻辑表示和演绎推理进行问题求解。 EBG 求解问题的形式 给定: 1.目标概念描述TC ; 2.训练实例TE; 3.领域知识DT ; 4.操作准则OC 。 求解: 训练实例的一般化概括,使之满足: 1.目标概念的充分概括描述TC 2.操作准则OC 。 神经学习 基于反向传播网络的学习 反向传播(back-propagation,BP)算法是一种计算单个权值变化引起网络性能变化值的较为简单的方法。 BP算法过程包含从输出节点开始,反向地向第一隐含层传播由总误差引起的权值修正。 基于Hopfield网络的学习 反馈神经网络,它是一种动态反馈系统,比前馈网络具有更强的计算能力。 Hopfield网络是一种具有正反相输出的带反馈人工神经元。 知识发现 知识发现的发展和定义 知识发现的产生和发展 知识发现最早是于1989年8 月在第11届国际人工智能联合会议的专题讨论会上提出。 知识发现的定义 数据库中的知识发现是从大量数 据中辨识出有效的、新颖的、潜在有用的、并可被理解的 模式的高级处理过程。 知识发现的处理过程 1.数据选择 根据用户的需求从数据库中提取与KDD 相关的数据。 2.数据预处理 主要是对上述数据进行再加工,检查数据的完整性及数据的一致性,对丢失的数据利用统计方法进行填补,形成发掘数据库。 3.数据变换 即从发掘数据库里选择数据 4.数据挖掘 根据用户要求,确定KDD 的目标是发现何种类型的知识。 5.知识评价 这一过程主要用于对所获得的规则进行价值评定,以决定所得的规则
显示全部