基于多特征的语义角色标注一致性计算方法研究.pdf
文本预览下载声明
北京大学学报(自然科学版) 第 54 卷 第 3 期 2018 年 5 月
Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 54, No. 3 (May 2018)
doi: 10.13209/j.0479-8023.2017.166
基于多特征的语义角色标注一致性计算方法研究
1,† 2 2 2
柯永红 朱永福 穗志方 俞士汶
1. 北京师范大学文学院 , 北京 100871; 2. 北京大学计算语言学教育部重点实验室 , 北京 100871; † E-mail: keyonghong@126.com
摘要 综合语义角色标注语料的格式、标签结构、标签内容和用户可信度等多个特征, 实现一种自动的语义
角色标注一致性计算方法。实验证明, 该方法对错误标注的召回率高 , 并且速度快 , 结果稳定 , 可以大幅度
地提高语义角色标注一致性检查的效率。
关键词 语料库 ; 多特征; 一致性计算 ; 语义角色标注
中图分类号 TP391
A Method for Semantic Roles Labeling Consistency Calculation
Based on Multi-features
1,† 2 2 2
KE Yonghong , ZHU Yongfu , SUI Zhifang , YU Shiwen
1. School of Chinese Language and Literature, Beijing Normal University, Beijing 100871; 2. Institute of Computational
Linguistics, Peking University, Beijing 100871; † E-mail: keyonghong@126.com
Abstract The authors state an automatic method for semantic role labeling consistency calculation, based on the
features of annotated corpus’ format, structure, content and user performances. The expriment shows that the
proposed method is fast, stable and has high recall rate, and it can greatly improve the quality and efficiency.
Key words corpus; multi features; consistency calculation; semantic role labelling
语料库是自然语言处理研究和应用的基础资 的准确性, 但是主观性强 , 效率低 , 代价高昂 , 是
源, 自然语言处理系统的性能和鲁棒性在很大程度 制约语料标注质量和效率的因素之一。本文尝试基
上取决于建模过程中是否有足够的高质量标注语 于多个特征来实现语义角色标注一致性的计算, 以
料。近年来 , 基于深度学习的深度神经网络 (deep 期提升语义角色标注一致性检查的速度和质量。
neutral
显示全部