声纹识别中MEL参数的提取研究.pdf
文本预览下载声明
研 究 与 设 计
声纹识别中MEL 参数的提取研究
黄成玉,张全柱,赖 斌
(华北科技学院信息与控制技术研究所,北京101601)
摘要:从说话人的语音信号中提取出能反映其个性特征的参数是声纹识别的关键环节之一。介绍了MEL 倒谱系数
(MFCC)及其提取方法,在此基础上提出了一阶差分(△MFCC) ,并将MFCC 和△MFCC 结合起来作为声纹识别的参
数进行了MEL 参数提取实验。实验结果表明将MFCC 和△MFCC 结合起来作为特征参数在识别性能上优于独立的
MFCC 。
关键词:声纹识别;MFCC ;△MFCC
中图分类号:TM 76 文献标识码:A 文章编号:1002- 087 X(2011)04- 0433- 03
Research on MEL parameter extraction from voiceprint recognition
HUANG Cheng-yu, ZHANG Quan-zhu, LAI Bin
(Information and Control Technology Research Institute, North China Institute of Science and Technology, Beij ing 101601, China)
Abstract: The extraction of parameters reflecting the characteristics of speakers speech signal is the key to
voiceprint recognition. MEL cepstrum coefficient (MFCC) and extraction method was introduced in this paper. On
this basis , the first difference ( △MFCC) was put forward.MFCC and △MFCC were combined to conduct an
experiment of parameter extraction from voiceprint recognition.The results show that the extraction combining MFCC
with △MFCC is superior to the independent MFCC.
Key words : voiceprint recognition; MFCC; △MFCC
声纹识别即说话人识别是一个模式识别问题,即模式归 语音信号是一种非平稳的时变信号,它携带着各种信息,
[1-2]
类问题, 它是利用人体生物特征进行身份认证的一种技术 。 在分析和研究各种语音信号时并不能直接将其用于说话人
声纹识别按其最终完成的任务可以分为两类,说话人确认和 识别系统中,必须先对其进行预处理。预处理阶段主要包括:
说话人辨认,前者用以判断某段语音是若干人中的哪一位所 采样量化,预加重,分帧、加窗等。美尔频率倒谱系数的提取流
说的,后者则用以确认某段语音是否真正就是某个特定的人 程如图 1 所示。
所说的。
声纹识别的关键问题之一就是提取出能够反映说话人个
显示全部