文档详情

语音清晰度的客观评测.ppt

发布:2025-03-22约2.97千字共10页下载文档
文本预览下载声明

LOGOLOGO*源于光通信中锐度的衰减**对于汉语而言,STIPA同样能够反映包括扩声系统在内的语言传输通道上各种干扰因素对语音清晰度的影响。STIPA与语音清晰度之间有着良好的一致性。**语音清晰度的客观评测中国传媒大学传播声学研究所章斯宇主要内容1语音清晰度评测的发展概况2混响作用下STIPA与清晰度的关系3噪声环境下STIPA与清晰度的关系4总结与展望1.语音清晰度的评测单击此处添加大标题内容语音的清晰度或可懂度是音质评价的重要指标—反映厅堂或扩声系统的声音传输质量主观评价:组织测试队伍实地测试(articulationtest)优点:直接、真实缺点:耗费人力物力GB-T15508-1995《声学语言清晰度测试方法》《语音清晰度的客观评价方法尽可能反映真实的清晰度水平主观测试%ALconSTIAI

清晰度指数AI(ArticulationIndex)

单击此处可添加副标题FrenchSteinberg(1947),Fletcher(1953),Kryter(1962)测量或估计语言频谱和听音人处的噪声有效掩蔽谱计算得到各频带的“有效信噪比”;对各频带信噪比进行线性转化至[0,1]得“贡献值”;基于不同频带对清晰度的贡献率加权平均得AI;ANSIStd.S3.5-1969\1986\1997特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引起的语音清晰度恶化程度,不能反映混响、回声或削峰等时域或非线性失真的影响。单击此处添加大标题内容辅音损失率%ALcon(articulationlossofconsonants)能不能根据测量房间内的某些物理量估计语音清晰度?Knudsen(1932),Peutz(1971),Klein(1971)根据大量的实地测量和清晰度主观评价测试的结果,Peutz发现%ALcon与房间的声学特性相关。Peutz公式(经验推导)注意:SNR25dB;单个无指向性的点声源(Q=1);D—听音处距声源的距离。单位m。T60—混响时间(1400Hz)。单位s。V—房间的体积。单位m3。ɑ—校准值。针对不同水平的听者。1.5%~12.5%。Dc—临界距离。单位m。Klein对Peutz公式的补充虽然提高扬声器的Q值有助于改善语音清晰度,但Q值与清晰度之间是否成简单的线性关系并没有实际的实验数据支持。Jacob(1985)认为语音清晰度与Q并无直接的关联。当房间声学特性难以改善时,采用电声手段提高语音清晰度。声源个数n;声源指向性因子Q;辅音损失率%ALcon的不足Jacob(1985)根据实验结果的经验推导,物理基础不够;对于信噪比低于25dB的情况估计不足,不能充分反映噪声和混响联合作用时的影响;没有考虑早期反射声,单次回响的作用,且结果仅给出某个频带的清晰度水平,未考虑参数的频率特性的影响;HougastSteeneken(1973\1980\1985)IECStd.60268-16充分反映声传递系统性能质量的优劣输入端:说话人发音语言传输指数STI(speechtransmissionindex)输出端:听者耳朵语言传输系统:充分考虑传递过程中噪声、混响、回响、系统失真等各种干扰因素的影响BlackBox调制转移函数MTF(modulationtransferfunction)连续的语音可以看成一系列语音碎片(音位)的组合。音位又可以看成是发音器官对某种窄带噪声调制的结果。音位的时域包络中包含了所传递的信息。传输过程中,噪声、混响、系统失真等会使得包络发生变化,从而导致清晰度恶化,利用MTF描述量化包络波动性能的变化程度。MTF的计算函数定义为声信号经传输后接收信号强度包络的调制度相对于原信号强度包络调制度的降低,它随调制频率不同而变化。STI的计算14种调制频率;7种倍频带噪声作为测试信号计算98个MTF结果类似AI计算中的加权平均最终得STI[0,1]根据房间脉冲响应可以直接计算MTFSTI与语音清晰度Steeneken(1980)不论是噪声、带通限制、削峰、混响等干扰因素,STI与语音清晰度得分之间始终有着良好的一致性。客观可测的物理参量STI能良好的反映和预测真实的语音清晰度水平。语言传输指数STI的简化算法500Hz1Hz2Hz4Hz8Hz2KHz0.7Hz1.4Hz2.8Hz5.6Hz11.2Hz限制条件:无明显非线性失真;环境噪声无脉冲;混响时间频率特性

显示全部
相似文档