基于高通平台的回声消除算法研究.pdf
基于高通平台的回声消除算法研究
摘要
近年来,虚拟现实技术取得了显著的发展,在这项技术的更迭之中,清晰的语音
交流对于用户沉浸在虚拟世界中的体验尤为关键,然而由于其佩戴方式和特殊的音频
环境,回声问题成为影响用户体验的主要障碍之一。为了保证音频的质量和效果,必
须对回声进行有效地消除。本文在深入探讨传统回声消除算法的基础上,结合当下流
行的深度学习技术对声学回声消除展开研究,主要工作和创新如下:
(1)针对分块频域自适应滤波算法中的步长选择进行了优化设计,结合卡尔曼滤
波回声消除算法构建了一个类卡尔曼增益系数来动态调整更新过程中的步长选择,校
正分块频域自适应滤波算法中的回声估计,并使用广义互相关算法来估计和降低参考
语音信号与回声信号之间的时间延迟,从而提高了滤波性能。优化后的算法仅在增加
了很小的计算成本下有着更快的收敛速度和更低的稳态误差,在远端单讲与双端讲话
场景下的回声消除性能均优于其他几种对比算法。
(2)针对非线性回声问题,构建了一种自适应滤波算法与神经网络相结合的声学
回声消除系统模型。通过改进后的分块频域自适应滤波算法消除线性回声,然后使用
构建的时域网络模型消除非线性等残余回声,结合二者优势有针对性地进行回声的消
除,并且提出合适的损失函数来引导网络模型的训练。该方法能够很好地减轻神经网
络的负担,所构建的网络模型不需要过于复杂,因此能够提高模型的部署效率和实际
应用可行性。实验结果表明该系统模型在参数量较少的同时有着良好的回声消除性能。
(3)构建了一种时频域结合的深度回声消除模型,基于该模型可以有效消除线性
与非线性回声以及背景噪声等问题。频域中的神经网络能够通过特征提取获得较为精
确的频谱信息,进而在频域内进行初步的回声消除,时域中的神经网络直接对语音信
号进行端到端的处理,能够更加准确地还原出纯净语音信号的时域波形。实验结果表
明,该时频域结合的深度回声消除模型有效地提高了回声消除的效果和所重构语音的
质量。
(4)基于搭载高通平台的VR设备实现了自适应滤波与神经网络相结合的回声消
除算法,通过实验证明,添加回声消除算法后的VR设备具有更好的回声消除性能,并
且能够满足实时性处理需求。
关键词:声学回声消除;自适应滤波;神经网络;残余回声消除;高通平台
基于高通平台的回声消除算法研究
Abstract
Inrecentyears,virtualrealitytechnologyhasmadesignificantdevelopment,inthechange
ofthistechnology,clearvoicecommunicationisparticularlycriticalforusersimmersedinthe
virtualworldexperience,butbecauseofthewaytheywearandthespecialaudioenvironment,
echoproblemhasbecomeoneofthemainobstaclesaffectingtheuserexperience.Toensure
thequalityandeffectofaudio,theechomustbeeffectivelyeliminated.Basedonanin-depth
discussionoftraditionalechocancellationalgorithms,thisthesisstudiesacousticecho
cancellationincombinationwiththecurrentpopulardeeplearningtechnology.Themainwork
andinnovationareasfollows:
(1)Thestepselectionintheblockfrequencydomainadaptivefilteringalgorithm