《基于双曲线空间的声纹识别规范》征求意见稿.pdf
ICS17.140
CCSA65/74
XXXX
团体标准
T/XXXXXX—20XX
基于双曲线空间的声纹识别规范
SpecificationofVoiceprintRecognitionBasedonhyperbolicspace
2022-XX-XX发布2022-XX-XX实施
粤港澳标准化与质量发展促进会发布
T/XXXXXX—20XX
前 言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规
定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由广州科慧健远医疗科技有限公司提出。
本文件由粤港澳标准化与质量发展促进会归口。
本文件起草单位:广州科慧健远医疗科技有限公司、武汉市昱呈星医疗科技有限责任公司、广州言
成智能设备股份有限公司、科慧健远(广州)智能设备有限公司、广州鼎成信息科技有限公司、广州科
慧健远科学研究院有限公司、广州鹏远智能设备有限公司、上海赛欧信息技术有限公司、广州贝鼎科技
有限公司、江苏雅泰歌思通讯技术有限公司、南京市恒临沣信息技术有限公司、广州高远数控科技有限
公司、雅泰歌思(上海)通讯科技有限公司、楚科云(武汉)科技发展有限公司、瑞湖智科数据(苏州)
有限公司、楚瑞智能科技(苏州)有限公司、广东问鼎科技发展有限公司英芙泰氪(青岛)科技有
、
限公司永迅亚洲有限公司。
、
本文件主要起草人:陈宜国、黄建恺、杨宇光、陈亮、闫景浩、黄鑫、卞成慧、张杨、徐江涛、朱
杰志、温炜杰、陈林晓
Ⅲ
T/XXXXXX20XX
—
基于双曲线空间的声纹识别规范
1范围
本文件规定了基于双曲线空间的声纹识别规范的术语和获取第一声纹信息、提取第一声纹信息特征、
目标特征获取、相似度计算、结果输出等进行规范。
本文件适用于声纹识别技术或方法等。
2规范性引用文件
本文件没有规范性引用文件。
3术语和定义
下列术语和定义适用于本文件。
3.1瞬时频率(Instantaneousfrequency)
将实数讯号表示为对应的复数讯号,即可定义复数讯号的大小与相位,将实数讯号的瞬时数据求出
的实数讯号的解析讯号的极坐标表示。
3.2MEL(Mel)
是Maya内置的一种Cammands命令语言,maya的所有操作包括maya的窗口都是基于Mel命令生成的。
3.3原始频域(Originalfrequencydomain)
描述原始获得的语音信号在频率方面特性时用到的一种坐标系。
4获取第一声纹信息
获取待识别的声纹信息进行预处理,得到第一声纹信息。通过提取第一声纹信息的MFCC(Mel
FrequencyCepstralCoefficient,梅尔倒谱系数)、LPCC(linearpredictivecepstralcoefficient,
线性预测倒谱系数)、PLP(PerceptualLinearPrediction,