到达时差估计的频域模型..docx
文本预览下载声明
到达时差估计的频域模型JesperRindom Jensen1, JesperKj?r Nielsen23, MadsGr?sb?ll Christensen1, S?renHoldt Jensen31Aalborg University2Bang Olufsen A/S3Aalborg UniversitAudio Analysis Lab, AD:MTStruer, Denmark Dept. of Electronic Systems{jrj,mgc}@create.aau.dk{jkn,shj}@es.aau.dkt摘要到达时差(TDOA)估计是音频信号处理应用中的一类重要问题,以前可以通过互相关方法解决。但本文表明,互相关方法实际上是通用的方法中的一个受约束的特例。因此,本文设置了条件使互相关方法成为统计有效的估算方法。其中一项条件是源信号为基本频率是rad/样本的周期信号,其中是数据点的个数或已知的谐波个数。而更通用的方法只要求源信号具有周期性,因此在对合成数据以及人工延迟的语音信号的估计准确度方面优于互相关方法。仿真代码可在网上获取。索引词——(分数)到达时差估计,基频估计,广义互相关引言在许多应用中,对一个未知信源的角度和位置的估计是一项重要课题。例如,在音频应用中,此类估计可用于区分说话人、抑制非所需的背景噪声和估算房屋的几何结构[1-3]。此类对到达方向和信源位置的估计问题可以归结为估算一个传感器阵列中各个传感器之间的到达时差,文中考虑两个传感器之间的到达时差。传感器对的到达时差估计通常需要将它输入用于处理至少两个扩音器记录的数据的算法(譬如流行的SRP-PHAT算法[1])中[2]。目前,在语音应用中计算到达时差估计最广泛应用的方法是基于相关方法的集合,或称广义互相关[4](GCC)方法。与雷达和声呐应用相比,此处的源信号是典型的宽带信号,因此一些对于窄带信号统计有效的算法不能在这直接使用,例如MUSIC[5]和ESPRIT[6]。另外,宽带版MUSIC方法的计算代价[7]比GCC方法的更高,并且当采用快速傅里叶变换算法的GCC方法在频域得以论证后,这类方法能够高效地应用。构建信号频域模型的另一项优势在于可以从源信号中提取延迟参数并将其模拟成连续参数。因此,大多数关于音频应用中的到达方向的估计和信源定位的论文都从频域模型开始研究。如果考虑最简单的到达时差估计参数模型,则本文的主要观点可以简单阐述。 (1),其中信号,和分别为第个传感器信号、源信号和传感器上的噪声。标量,分别是样本源信号从传感器1到2的衰减和相对延迟。如果源信号是一个基频为rad/样本(或其整数倍)的周期信号,则公式(1)中的模型在频域内可写成: (2),其中,,分别为是信号,和的离散傅里叶变换系数。公式(2)中的频域模型存在一些问题。首先是局限性太强,虽然音频应用中的信号源通常在较短的时间范围内近似具有周期性,但实际中,该假设在基频上通常难以令人满意,会产生边缘效应[8-10]。通过适当地补零可以避免边缘效应,但是会通过一个秩亏相关矩阵丰富噪声频谱[8]。另一个问题是,由于一个实数源信号中的非整数延迟会产生一个复数的传感器信号,公式(2)中的频域模型没法用于分数TDOA估计!针对这些问题,本文提出一种不同的模型,假定源信号具有周期性但基频不是rad/样本。将基频模拟成一个未知的参数并联合TDOA和DOA对其估计已经不是新思想[11-15]。然而本文表明,该模型比传统频域模型更具广泛性,因为后者是前者的一个特例。本文还设立了条件使互相关方法成为统计有效的估计方法。由此,本文为联合基频和到达时差估计提出了一种新型的近似最大似然估计方法,在处理合成数据和人工延迟的声音数据方面的性能均优于互相关方法。相比于传统互相关算法,该估计方法无需使用内插方法就能产生分数延迟估值。联合基频与到达时差估计正如引言中所提到的,本文不对基频信号的模型做任何假设。如下文中详述,本文假定源信号是具有一个未知基频和数量未知的谐波成分的周期性信号。本文还假定噪声为高斯白噪声。尽管可能导致对大混响音频的估计性能不佳,这些假设已经足以论证本文的主要观点。2.1.模型任意一个平均值为0的实数周期性源信号可以写成 (3)其中,,,分别是幅度、相位、基频和复振幅。记,相当于实际中源信号无直流分量。如果将源信号延迟,得(4)此处定义。公式(1)中的信号模型可写成矩阵向量形式 (5)此处定义另外,假设噪声是方差为的高斯白噪声,则观测模型符合标准正态分布,概率密度函数(pdf)为(6)其中是的单位矩阵。2.2.一种近似最大似然估计方法公式(6)中的观测模型包含线
显示全部