数据压缩与信源编码第四章.doc
文本预览下载声明
第四章
1、详细解释下面概念:(a)绝对掩蔽门限;(b)临界频带;(c)听觉门限;(d)掩蔽效应。
(a)绝对掩蔽门限:被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯
音的最小值称为绝对掩蔽门限。
(b)临界频带:当噪声掩蔽纯音时,起作用的是以纯音频率为中心频率的一定频带宽度内的噪声
频率。如这频带内的噪声功率等于在噪声中刚能听到的该纯音的功率,则这频带就称为听觉临界
频带。
(c)听觉门限:刚刚能引起感觉的最小刺激量,称为感觉阈下限;能产生正常感觉的最大刺激量
,称为感觉阈上限。刺激强度不允许超过上限,否则,不但无效而且还会引起相应听觉器官的损
伤。
(d)掩蔽效应:一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象
称为人耳的“掩蔽效应”。
2、详细说明:(a)什么是心理声学模型,它的输入和输出分别是什么?
心理声学模型是对人听感的统计性质的数学表述模型,它解释人各种听感的生理原理。输入是声
音信号,输出是编码数据流。
(b)心理声学模型在音频编码中的作用?
心理声学原理应用到音频压缩技术中,使获得低比特传输速率和透明音质成为可能。
3、(a)MPEG-1音频编码分几层,各层在编码效率、算法复杂度和算法延迟上有和区别?
三层,MPEG-1 Layer1采用每声道192kbit/s,每帧384个样本,32个等宽子带,固定分割数据块。
MPEG-1 Layer2采用每声道128kbit/s,每帧1152个样本,32个子带,属不同分帧方式。MPEG-1
Layer3采用每声道64kbit/s,用混合滤波器组提高频率分辨率,按信号分辨率分成6X32或18X32个
子带,克服平均32个子带的Layer1,Layer2在中低频段分辨率偏低的缺点。
(b)画出mp3音频编码编解码算法框图,并详细说明其工作原理。
4、(a)什么是预回声(pre-echo)?
在变换编码中,频域中的量化误差经解码后会扩散至整个食欲音频帧内,这样就会在原本没有声音的时刻出现可闻的声音,即预回声。
(b)音频编码中为何要进行预回声处理?
在音频编码中,特别当比特率较低时,预回声引起失真是比较严重的问题。
(c)MP3和AAC等音频编码算法中是如何进行预回声处理的?
MP3:子带编码
AAC:基于动态分块的自适应窗口切换算法
5、查阅资料,然后说明MPEG-4 Audio中包括那些内容,详细说明之。
MPEG-4 Audio Object Types:
0: Null
1:?HYPERLINK http://www.wiki.multimedia.cx/index.php?title=AAC \o AAC AAC?Main
2:?HYPERLINK http://www.wiki.multimedia.cx/index.php?title=AAC \o AAC AAC?LC (Low Complexity)
3:?HYPERLINK http://www.wiki.multimedia.cx/index.php?title=AAC \o AAC AAC?SSR (Scalable Sample Rate)
4:?HYPERLINK http://www.wiki.multimedia.cx/index.php?title=AAC \o AAC AAC?LTP (Long Term Prediction)
5: SBR (HYPERLINK http://www.wiki.multimedia.cx/index.php?title=Spectral_Band_Replication \o Spectral Band Replication Spectral Band Replication)
6:?HYPERLINK http://www.wiki.multimedia.cx/index.php?title=AAC \o AAC AAC?Scalable
7:? HYPERLINK http://www.wiki.multimedia.cx/index.php?title=TwinVQ \o TwinVQ TwinVQ
8:?HYPERLINK http://www.wiki.multimedia.cx/index.php?title=CELPaction=edit \o CELP CELP?(Code Excited Linear Prediction)
9: HXVC (Harmonic Vector eXcitation Coding)
10: Reserved
11: Reserved
12: TTSI (Text-To-Speech
显示全部