文档详情

中文语义角色标注的特征工程-中文信息学报-中国中文信息学会.pdf

发布:2017-11-24约2.31万字共6页下载文档
文本预览下载声明
第 2 1 卷  第 1 期 中文信息学报 Vol . 2 1 , No . 1 2007 年 1 月 J OU RN AL O F C H IN ESE IN FO RMA T ION PROCESSIN G J an . , 2007 文章编号 : (2007) 0 1007906 编者按  中国中文信息学会于 2006 年 8 月在沈阳航空工业学院人机智能研究中心成功地召开了 ( ) “第三届全国学生计算语言学研讨会 SWCL 2006 ”。会议的程序委员会向本刊推荐出八篇优秀论 ( ) 文 经专家评审后 ,作者又做了修改 ,编辑部得到授权 ,在此发表 , 以飨读者 。 中文语义角色标注的特征工程 刘怀军 , 车万翔 ,刘 挺 ( 哈尔滨工业大学 信息检索实验室 ,黑龙江 哈尔滨 15000 1) 摘  要 : 基于统计机器学习的语义角色标注在 自然语言处理领域越来越受到重视 ,丰富多样的特征直接决定语义 角色标注系统的性能 。本文针对中文的特点 ,在英文语义角色标注特征的基础上 ,提出了一些更有效的新特征和 组合特征 : 例如 ,句法成分后一个词 、谓语动词和短语类型的组合 、谓语动词类别信息和路径 的组合等 , 并在 Chinese Propo sition Bank ( CPB) 语料数据上 , 使用最大熵分类器进行了实验 , 系统 FScore 由 89 . 76 % 增加到 9 1. 3 1 % 。结果表明 ,这些新特征和组合特征显著提高了系统的性能 。因此 , 目前进行语义角色标注应集中精力寻 找丰富有效的特征 。 关键词 : 计算机应用 ; 中文信息处理 ;语义分析 ;语义角色标注 ;特征工程 ;最大熵分类器 中图分类号 : TP39 1     文献标识码 : A Feature Engineering f or Chinese Semantic Role Label ing L IU Huaij un , C H E Wanxiang , L IU Ting ( Information Ret rieval L aboratory , Haerbin In stit ut e of Technology , Haerbin , Heilongj iang 150006 , China) Abstract : In t he nat ural language p rocessing field , researcher s have exp erienced a growt h of int erest in semantic role labeling by app lying st ati stical and machinelearning met ho ds. U sing rich feat ures i s t he mo st import ant p art of semantic p ar sing sy st em . In t hi s p ap er , some new effective feat ures and combination feat ures are p ropo sed , such a s next wor d of t he con stit uent , p redicat e and p hra se t yp e combinat
显示全部
相似文档