语义网络模型 - 语言文字网.ppt
文本预览下载声明
人工语言脑:语义网络 南京师范大学 语言科技研究所 李葆嘉 引 言 1.计算机处理自然语言的技术,可以分为语言文本处理技术和语言能力模拟技术。 语言能力模拟技术包括语音合成、机译系统和自然语言处理装置。 面向智能机研制的自然语言处理装置,其实质就是人工语言脑。 2.自然语言能力是在语言系统的建构和言语行为的交际过程中逐步实现的。个体语言能力的生长过程,为自然语言能力移植的仿生工程提供了蓝本。 3.计算机不具备语义网络的自建构能力,必须为之建构以供语言编码和解码之用的可计算语义网络。 一、人工语言脑的学术背景 1.语义语法学理论(李2000) 2.中国元语言理论(李2001) 3.个体语言生长论或内核模型论(李2002) 4.语言系统受限理论(李2002) 1.个体语言生长论或核心模型论 2.中国元语言理论 3.语义语法学理论 自然语言能力是什么? 自然语言结构怎么样? (1)人类语言的本质属性是语义性 (2)语义系统的本质特点是网络性 (3)语义网络的形成过程是建构性 (李葆嘉2001) 以词类划分、成分分析、句型归纳为主要特征的语法研究是语形语法学。 基于语义性、网络性和建构性的语义语法学。 句法结构的本质是相关义场的语义关联。 语形手段的本质是语义范畴和结构模式的标记化。 结构语义隐含在词汇语义中,凡聚合义场皆包孕语义框架。 语言编码过程可界定为语义关联,即基于语义网络相关义场之间的节点激活。 语言解码过程可界定为语义换算,即基于语义网络相关义场之间的相互阐释。 4.语言系统受限理论 面对耗散性语言系统,与乔姆斯基选择演绎法相反,既然完全归纳并非人类天赋,我们就可以根据特定的研究目标选择特定的受限对象,自觉地从事受限系统和受限能力研究。 移植进计算机的自然语言系统,实际上是经过剪裁的、最接近自然语言的人工符号系统。 二、人工语言脑的研制思路 如何教计算机一步步学说话? (一)语言基因图谱分析工程 (二)认知语义网络建构工程 (三)受限语言能力模拟工程 (李葆嘉2002) 人工语言脑研制流程图一 基础工程 人工语言脑研制流程图二 关键工程 人工语言脑研制流程图三 目标工程 三、人工语言脑的核心 以义征挖掘和义场建构为基础, 以语义范畴提取和语义句模抽象为中枢, 以语义网络建构为目标。 义 网 模 型 示例 义征、义场、范畴、句模纵横交错构成分层次、多维度的语义网络。 最小颗粒度:语义特征 最大颗粒度:句法结构 基本功能:生成话语和理解话语 话语生成机制:语义网络激活 基于语义网络可以进行语义范畴的距离度计算,以生成话语。 话语理解机制:语义单位换算 基于语义网络可以进行语义单位的理解度换算,以理解话语。(略) 话语运用机制:语境模型适应(略) 人工语言脑=语义网络+语境模型+知识背景 谢谢诸位! * * Artificial Language Brain Semantic Net 未经李葆嘉授权,任何复制和使用都属于侵权 微型语言 大型语言 中型语言 仿生 工程 0-5岁 6-18岁 19岁以上 我们像蜘蛛一样…… 认知元语言 析义元语言 释义元语言 词汇元语言 人类自然语言 对象 语言 工具 语言 词元 释元 义元 知元 语法研究的出发点和归宿都是语义。 受限词汇系统 词汇元语言集 释义元语言集 析义元语言集 性状义征 聚合义征 语用义征 汉语义征提取 语言 基因 图谱 分析 工程 组合义征 语形规则集 图示一 认知语义网络建构工程 语义网络 话语生成和理解机制 语码换算 语篇结构 聚合义场 语义范畴 组合义场 语义句模 图示二 日常语言能力 会话策略库 语境模型库 百科知识库 日常会 话规则 专业知识 获取能力 受限语言 能力 模拟 工程 专业语言 基础能力 专业语言能力 图示三 Semantic Net 动作 吃 主体施事 亲称 称谓 名称 社称 体征 性别 长幼 籍属 关系 职业 佐料 味道 姓名 主食 辅食 菜肴 中药 西药 补药 时空 时体 工具 可能 结果 身份 生理 口味 食物 药品
显示全部