中文语义角色标注的特征工程-中文信息学报-中国中文信息学会.pdf
文本预览下载声明
第 2 1 卷 第 1 期 中文信息学报 Vol . 2 1 , No . 1
2007 年 1 月 J OU RN AL O F C H IN ESE IN FO RMA T ION PROCESSIN G J an . , 2007
文章编号 : (2007) 0 1007906
编者按 中国中文信息学会于 2006 年 8 月在沈阳航空工业学院人机智能研究中心成功地召开了
( )
“第三届全国学生计算语言学研讨会 SWCL 2006 ”。会议的程序委员会向本刊推荐出八篇优秀论
( )
文 经专家评审后 ,作者又做了修改 ,编辑部得到授权 ,在此发表 , 以飨读者 。
中文语义角色标注的特征工程
刘怀军 , 车万翔 ,刘 挺
( 哈尔滨工业大学 信息检索实验室 ,黑龙江 哈尔滨 15000 1)
摘 要 : 基于统计机器学习的语义角色标注在 自然语言处理领域越来越受到重视 ,丰富多样的特征直接决定语义
角色标注系统的性能 。本文针对中文的特点 ,在英文语义角色标注特征的基础上 ,提出了一些更有效的新特征和
组合特征 : 例如 ,句法成分后一个词 、谓语动词和短语类型的组合 、谓语动词类别信息和路径 的组合等 , 并在
Chinese Propo sition Bank ( CPB) 语料数据上 , 使用最大熵分类器进行了实验 , 系统 FScore 由 89 . 76 % 增加到
9 1. 3 1 % 。结果表明 ,这些新特征和组合特征显著提高了系统的性能 。因此 , 目前进行语义角色标注应集中精力寻
找丰富有效的特征 。
关键词 : 计算机应用 ; 中文信息处理 ;语义分析 ;语义角色标注 ;特征工程 ;最大熵分类器
中图分类号 : TP39 1 文献标识码 : A
Feature Engineering f or Chinese Semantic Role Label ing
L IU Huaij un , C H E Wanxiang , L IU Ting
( Information Ret rieval L aboratory , Haerbin In stit ut e of Technology , Haerbin , Heilongj iang 150006 , China)
Abstract : In t he nat ural language p rocessing field , researcher s have exp erienced a growt h of int erest in semantic role
labeling by app lying st ati stical and machinelearning met ho ds. U sing rich feat ures i s t he mo st import ant p art of
semantic p ar sing sy st em . In t hi s p ap er , some new effective feat ures and combination feat ures are p ropo sed , such a s
next wor d of t he con stit uent , p redicat e and p hra se t yp e combinat
显示全部