语音信号处理作业4 .pdf
语音信号处理技术的发展历程与趋势
学号:201005103
1语音信号处理技术的发展历程
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言
是人类特有的功能,声音是人类常用的工具,是相互传递信息的最主要手段。它具有最大
的信息容量和最高的只能水平。因此,用现代的手段研究语音处理技术,使人们能更有效
的产生、传输、存储、获取和应用语音信息,对于促进社会发展具有十分重要的的意义。
语音信号处理正是一门研究用数字信号处理技术和语音学知识对语音信号进行处理的
新兴学科,是目前发展最为迅速的信息科学研究领域的核心技术之一,同时又是综合性的
多学科领域和涉及面很广的交叉学科。语音信号处理的理论和研究包括紧密结合的两个方
面:一方面是从语音的产生和感知来对其进行研究,这一研究语音.语言学、认知科学、心
理.生理学等学科密不可分。另一方面是将语音作为一种信号来进行处理,包括传统的数字
信号处理技术以及一些新的应用与语音信号的处理方法和技术。
20世纪60年代中期形成的一系列数字信号处理方法和算法,如数字滤波器、快速
傅里叶变换(FFT)是语音数字信号处理的理论和技术基础。
而70年代初期产生的线性预测编码(LPC)算法,为语音信号的数字处理提供了一
个强有力的工具。广泛的应用于语音信号的分析、合成及各个应用领域,以及用于输入语
音与参考样本之间时间匹配的动态规划方法。
80年代初一种新的基于聚类分析的高效数据压缩技术——矢量量化(VQ)应用于语
音信号处理中。而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信
号处理技术的重大发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时它
的许多成果也体现在有关语音信号处理的各项技术之中。
进入20世纪90年代以来,语音信号处理在实用化方面取得了许多实质性的研究进
展。其中,语音识别逐渐由实验室走向实用化。一方面,对声学语音学统计模型的研究逐
渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工神经网络的结
合成为研究的热点。另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快
速搜索识别算法以及进一步的语言模型的研究等课题倍受关注。语音信号的编码和压缩是
语音信号处理的主要内容。语音信号处理在通信语音识别与合成、自然语音理解、多媒体
数据库以及互联网等多个领域有广泛的应用,同时它对于理解音频类等一般的声音媒体的
特点也有很大的帮助。对于移动通信来说,最多的信息是语音信号,语音编码的技术在数
字移动通信中具有相当关键的作用。高质量低速率的语音编码技术是数字移动网的永远
的追求。所谓语音编码是信源编码,它是将模拟语音信号编程数字信号以便在信道中传输。
除了通信带宽的要求外,计算机存储容量的限制也要求对语音信号进行压缩,以满足海量
数据情况下进行实时或准实时计算机处理的目的。语音信号数字处理技术在国民经济、日
常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间。众所周知,语音在人
类社会中起了非常重要的作用。在现代信息社会中,小至人们的日常生活,大到国家大事、
世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、移动电
话和互联网已经普及到家庭。在这些先进的工具中,语音信号处理中的语音编码和语音合
成就有很大贡献。再进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文
字)、语音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程
上的研究工作了。
2语音信号处理的内容
2.1语音信号所包含的信息量
语音信号中到底包含了多少信息量,需要多少比特才能够无失真地表示它们,这对于语音编
码、语音合成和语音识别的研究都是很有用的。但是这也是一个很复杂的问题,它涉及到
对于信号失真的评价。下面列举了三种评价,其中两种是由弗雷雷格(Flanagan)给出的,另
一种是由约翰斯登(Johnston)提出的。它们是建立在下面三种不同的失真评价上:(1)语音信
号的信噪比;(2)接收语音信号时,信号由听觉外围处理以后,人们在主观上能够感觉到的
失真;(3)人在接收语音信号时,不正确接收音素的数目和正确接收音素数目的比值。
2.2语音信号分析
语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参
数,才可能利用这些参数进行高效的语音通