实体识别技术研究进展综述.pdf
第22卷第5期太赫兹科学与电子信息学报Vol.22,No.5
2024年5月JournalofTerahertzScienceandElectronicInformationTechnologyMay,2024
文章编号:2095-4980(2024)05-0503-13
实体识别技术研究进展综述
12111
马艺洁,赖海光,刘子威,杨楠,张更新
(1.南京邮电大学卫星通信研究所,江苏南京210003;2.南京控维通信科技有限公司,江苏南京211135)
摘要::实体识别技术作为知识图谱构建的重要步骤,已广泛用于语义网络、机器翻译、问
答系统等自然语言处理中,在推动自然语言处理技术落地实践的过程中起着非常关键的作用。本
文根据实体识别技术的发展历程调研了现有的实体识别方法,主要为早期基于规则和词典的实体
识别方法、基于机器学习的以及基于深度学习的命名实体识别方法;整理了每种实体识别方法的
关键思路、优缺点和具有代表性的模型,特别对目前使用较多的基于双向长短期记忆网络
(BiLSTM)模型和基于Transformer模型的实体识别方法进行了概述;介绍了目前主流的数据集以及
评价标准。最后,面向未来机器类通信的语义需求,总结了实体识别技术面临的挑战,并对其未
来在物联网业务数据方面的发展进行了展望。
关键词::实体识别;语义提取;深度学习;知识图谱
中图分类号::TN927.2文献标志码::Adoi::10.11805/TKYDA2023436
OverviewoftheresearchprogressinentityrecognitiontechnologyOverviewoftheresearchprogressinentityrecognitiontechnology
MAYijie1,LAIHaiguang2,LIUZiwei1,YANGNan1,ZHANGGengxin1
(1.InstituteofSatelliteCommunication,NanjingUniversityofPostsandTelecommunications,NanjingJiangsu210003,China;
2.CowaveSatelliteCommunicationTechnologyCo.,Ltd,NanjingJiangsu211135,China)
AbstractAbstract::Entityrecognitiontechnology,asanimportantstepinconstructingknowledgegraphs,has
beenextensivelyappliedinnaturallanguageprocessingapplicationssuchassemanticnetwork,machine
translation,andquestionansweringsystems.Itplaysacrucialroleinpromotingthepracticalapplication
ofnaturallanguageprocessingtechnology.Accordingtothe