《基于网络融合的声纹识别规范》编制说明.pdf
《基于网络融合的声纹识别规范》
编制说明
一、标准制定的必要性
本项目的主要目的在于克服现有技术的缺点与不足,
提供一种基于网络融合的声纹识别规范,以解决现有的声
纹识别过程中,同一个人的声音具有易变性,易受身体状
况、年龄、情绪等的影响;比如不同的麦克风和信道对识
别性能有影响;比如环境噪音对识别有干扰;又比如混合
说话人的情形下人的声纹特征不易提取等问题。
二、项目背景及工作情况
(一)项目背景
声纹识别,生物识别技术的一种,也称为说话人识别,
包括说话人辨认和说话人确认。声纹识别就是把声信号转
换成电信号,再用计算机进行识别。不同的任务和应用会
使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨
认技术,而银行交易时则需要确认技术。
在现有的声纹识别过程中,同一个人的声音具有易变
性,易受身体状况、年龄、情绪等的影响;比如不同的麦
克风和信道对识别性能有影响;比如环境噪音对识别有干
扰;又比如混合说话人的情形下人的声纹特征不易提取;
为此,提出基于网络融合的声纹识别方法及系统的规范。
1
(二)任务来源
为实现不同的麦克风和信道对声纹识别性能有影响;
环境噪音对识别有干扰;混合说话人的情形下人的声纹特
征不易提取等技术难题的解决。广州科慧健远医疗科技有
限公司提出制定该项团体标准。
(三)标准起草单位
本标准的主要起草单位是广州科慧健远医疗科技有限
公司、武汉市昱呈星医疗科技有限责任公司、广州言成智能
设备股份有限公司、科慧健远(广州)智能设备有限公司、
广州鼎成信息科技有限公司、广州科慧健远科学研究院有限
公司、广州鹏远智能设备有限公司、上海赛欧信息技术有限
公司、广州贝鼎科技有限公司、江苏雅泰歌思通讯技术有限
公司、南京市恒临沣信息技术有限公司、广州高远数控科技
有限公司、雅泰歌思(上海)通讯科技有限公司、楚科云(武
汉)科技发展有限公司、瑞湖智科数据(苏州)有限公司、
楚瑞智能科技(苏州)有限公司、广东问鼎科技发展有限公
司、英芙泰氪(青岛)科技有限公司、永迅亚洲有限公司参
与起草。
(四)标准研制过程及相关工作计划
1.团体标准《基于网络融合的声纹识别规范》在
2022年7月完成了项目可行性分析,标准的研制工作于
2022年7月正式启动,选择、确定技术水平高、责任心强
2
的专业技术人员,组建了标准起草小组。
2.2022年7月中旬提出了标准框架,并根据标准的
框架结构进行资料收集,编写了标准草案,向粤港澳标准
化与质量发展促进会递交资料提出立项申请。
3.2022年8月,完成标准草案的完善,并小范围内
部征求意见,根据反馈意见修改形成《征求意见稿》,全
面公开征求意见。
4.2022年10月,起草小组将根据《征求意见稿》的
反馈意见,对意见进行处理并进一步完善标准,形成标准
送审稿。
5.计划2022年10月提交标委会技术审查和报批。
6.计划2022年10月在全国团体标准信息平台公示
及发布。
三、标准制定的基本原则
本标准遵守和符合相关法律法规、强制性标准要求,充
分考虑目前国内外数字通信技术领域的特点和现状,结合工
作实践和相关研究成果而加以制定。
四、标准编写依据及主要内容
本标准按照GB/T1.1—2020的规定进行编写,相关内
容经过了验证,具有较强的可操作性和科学性。根据调研
情况,意见收集情况分析,确定标准的主要技术内容包括:
提出基于网络融合的声纹识别系统,包括注册登录模块、
语音采集模块、声纹处理模块、服务器以及声纹识别模块。
3
五、与有关法律法规和强制性标准的关系
遵守和符合相关法律法规和强制性标准要求。
六、相关国内标准情况简要说明
目前国内尚无相关标准。
七、重大意见分歧的处理依据和结果
本标准在制定过程中未出现重大分歧意见。
八、后续贯彻措施
计划从三个方面