神经网络语音识别研究及进展.pdf
文本预览下载声明
维普资讯
/
一
A摘要 论述了在语音识别中听觉神经网络模型
、 BP同络、时延神经同络、自组织影射、学习矢量量化和神经I$,0.1N
络 的优缺点及神经网络语音识别的发展动态。
关键词匿童堡型芷丝旦垫哩堕堡兰 -rA/ i孚
汇及20000词汇的识别率分别为97.1 和94.6
1 引言
INRS依赖于话者的系统 ,75000词汇的识别率为
80年代 中期开始了神经网络的第二次研究高 89.5 。HMM 之所 以在语音识别中应用较为成功 ,
嘲,人工神经网络 (ANN)具有 自适应性 、并行性 、非 主要是它具有较强的对时间序列结构的建模能力。
线性、鲁棒性、容错性和学习特性,近年来发展迅速 , 尽管如此,HMM 技术也存在缺点,它不同于人脑的
并被用于语音识别领域,在结构和算法上都显示出 处理理解方式,其 自适应能力、鲁棒性都不理想,主
实力。它可以联想模式对,将复杂的声学信号影射为 要表现在对低层次的声学音素建模能力差 ,使声学
不同级别的语音学和音韵学的表示 .不必拘束于选 上相似的词易混淆+对高层次语音理解或语义建模
取特殊的语音参数 .而对综合的输入模式进行训练 能力差,这使它仅能接受有限状态或概率文法等简
和识别 ,可把听觉模型融于同络模型之中。ANN用 单应用场合 由于~阶HMM 假设输出是相互独立
于语音识别需要解决几个 问题 ,一是如何使ANN 的,它很难直接用模型描述协同发音 .另外HMM
具有一定的反应语音时变特性的能力;二是基本神 需对状态的分布作先验假设+而它并不一定适宜于
经网络的输入节点是固定的,而语音信号的时长变 语音信号
化都很大,两者之间的矛盾如何解决}三是ANN学
3 人工神经网络 (ANN)模型
习时间太长+随着网络增大,该问题尤为突出;四是
要考虑语音识别基元在语音流中的稳定性,识别基 通常语音识别神经阿络可分为两大类,一类是
元越小,计算量也越小,但 同时带来的问题是怎样分 神经网络或神经网络与传统的HMM、DP相结合的
割和定位小基元所对应的语音段,另~b11,基元在转 混合网络,另一类是根据人耳听觉生理学、心理学研
换至音节、词和句子时,所需的规则很难描述。目前 究成果建立听觉神经网络模型。主要从 以下几个方
的研究是找到对语音信号更强有力的神经网络 面做工作:
(NN)模型.更适宜的激活函数,更高速有效的学习 1)缩小建模单元,一般在音素上建模,通过提
算法和更合理的结构。 高音素的识别率来提高整个系统的正识率。
2)对声学模型、听觉模型、大脑运行机制进行
2 隐马尔可夫模型(HMM)和它的缺陷
深入研究,对语音信号引进上下文信息,以减少语音
大词汇量、连续语音的非特定人语音识别系统 多变化的影响。
大多数是基于 HMM 方法 ,它在语音识别 中起着非 3)从语音信号中提取多种特征,采用混合网络
常重要的作用.该方法 已日臻成熟。如SPHINX语 模型,并应用多种知识源(音素、词汇、句法、词意)进
音识别系统。],对997个词的连
显示全部