一种改进的基于分析合成框架的语音增强算法.PDF
文本预览下载声明
NCMMSC2015 中国天津 2015 年10 月
一种改进的基于分析合成框架的语音增强算法
1 1 2
刘斌 ,陶建华 ,莫福源
(1. 中国科学院自动化研究所 模式识别国家重点实验室,北京 100190;
2. 中国科学院声学研究所 北京 100190)
文 摘: 本文提出了一种基于分析合成框架的语音增强算法;应用一种改进的基于多带梳状滤波方法计算基音周期
并判定各个子带的清浊状态;相对于不同基线方法,改进后的算法具有更低基音周期估计误差和更高的清浊判定准确
率;引入深层神经网络模型增强线谱对参数,通过该模型重构的线谱对参数误差低于传统方法;将改进基音周期估计
方法和线谱对增强方法应用到基于分析合成框架的语音增强算法中,实验结果表明,这种基于分析合成框架的语音增
强算法的性能优于各种基线方法,集外测试具有更高的PESQ 得分。此外上述改进的方法可以直接应用到参数化语音
编码算法中,尤其可以改善噪声环境下低速率语音编码的音质。
关键词:分析合成框架;多带梳状滤波;深层神经网络模型;语音增强
中文图书分类号:TP391.
计算,然而大多数预增强算法难以保留谱包络特
单通道语音增强是语音信号处理领域的一个 征;通过增强谱包络信号,可以有效的提高合成语
重要分支,它在语音识别、语音编码、说话人识别 音的质量和可懂度。在噪声环境下提取鲁棒的语音
等许多系统中有着广泛的应用,通常作为系统的预 参数对提高语音增强算法性能至关重要。基于分析
处理阶段;通过有效的语音增强算法可以改善语音 合成框架的语音增强问题可以分解为噪声环境下
的音质和可懂度。然而从各种复杂噪声环境下对语 的基音周期估计和子带清浊判决、噪声环境下的谱
音信号进行增强处理一直以来都是一个非常具有 包络增强、噪声环境下语音信号的增益估计和声码
挑战性的课题,尤其是在低信噪比时、面临非平稳 器重构增强语音四个子问题。
噪声条件下这一问题尤为突现。 噪声环境下的基音周期估计算法可以分为三
一些单通道语音增强方法相继提出,其中最为 类:基于时域的基音周期估计[4]、基于频域的基音
流行的是谱减法[1]、最小均方误差法[2]和基于听觉 周期估计[5]和基于时频域的基音周期估计[6]。基于
场景分析的语音增强算法[3] 。谱减法的缺陷是增强 时域的基音周期估计直接分析信号在时间轴上的
的语音信号会带有音乐噪声;在各种语音增强算法 周期性,基于频域的基音周期估计通过在频域上分
中,基于最小均方误差的语音增强方法得到了广泛 析语音短时谱的谐波特性来估计基音周期,基于时
的关注,它在一些噪声环境下表现出较好的性能。 频域的基音周期估计通常将信号划分成多个子带,
主要原因有两个方面,首先,该方法结合听觉感知 然后分别在各个子带中进行时域分析。基于多带梳
重点对幅值谱进行准确的估计,考虑到相位谱对人 状滤波的基音周期估计是一种主流的基于时频域
耳听感较弱,因此并没有对相位谱进行增强;其次, 的基音周期估计方法,这种方法考虑了人耳的听觉
该方法基于贝叶斯准则,充分利用先验知识对幅值 感知特性,对噪声环境具有很好的鲁棒性。基于这
谱进行估计;但是这种方法在低信噪比和非平稳噪 种方法进行改进,有人提出基于加权信噪比的多带
声条件下性能明显下降。针对这一问题,有人提出 梳状滤波方法对基音周期进行估计[7],该方法可以
了基于分析合成框架的语音增强方法,该方法首先 进一步提高噪声环境下基音周期估计的精度。对于
在噪声环境下对语音信号的基频、谱包络和能量进 浊音度较高的子带,通常会呈现明显的共振峰结
行相对准确的估计,语音信号在参数域进行增强, 构,可以重点利用
显示全部