文档详情

基于深度学习神经网络的语音识别研究-信号与信息处理专业论文.docx

发布:2019-03-28约6.92万字共70页下载文档
文本预览下载声明
摘 摘 要 I万方数据 I 万方数据 摘 要 深度学习是近年来在机器学习领域出现的一个新的研究热点,其最早源于人工神 经网络(ANN)的研究。它通过模仿人脑多层次的模型结构,对底层信息经过多层非线 性变换,逐步提取低层特征形成更加抽象的高层表示,来发现数据的本质特征。将深 度学习技术结合多层神经网络应用于语音识别的研究,具有重要的理论意义和实用价 值。 本文首先对语音识别系统的基本原理和隐马尔科夫模型(HMM)的基础知识进行 了讲解,综述了传统的语音识别方法并分析了它们的优缺点。对预加重、端点检测、 特征参数提取等过程都进行了仿真实验。 论文重点研究了基于深度学习的多层神经网络。对标准误差反向传播(BP)算法和 改进的 BP 算法进行了仿真实验,通过对比改进方案前后的实验效果,可以看出改进 的 BP 算法能够加快网络训练速度,提高效率。 深度自编码(DAE)网络是一种典型的深度学习模型,它由多个自编码器(AE)组 成。DAE 网络在训练时,先通过无监督学习,完成对隐含层的预训练,然后再用 BP 算法对网络进行精调,这样可以改善传统 BP 算法的缺陷,提高网络性能。本文利用 Matlab 软件分别构建了 DAE 网络和传统的 BP 神经网络,对孤立词识别进行了仿真 实验,结果表明 DAE 网络识别准确率较 BP 神经网络有 20.0%的提升。 将深度学习应用于连续语音识别更有实际意义。在连续语音识别中,利用深度神 经网络(DNN)对声学特征建模,可以更好地提取语音信号的特征,从而有利于识别。 另外,DNN 声学模型在与 HMM 结合时,不需要对特征参数的分布进行假设,更符 合真实情况。论文最后利用开源语音识别工具 Kaldi 在 TIMIT 语音库上进行了基于 DNN 的连续语音识别实验,对于开发集和测试集词错误率分别为 18.1%和 19.0%,与 其他语音识别方法相比性能有大幅提升,从而验证了深度学习算法的有效性。 关键词:语音识别;深度学习;神经网络;隐马尔科夫模型;Kaldi 工具箱 Abst Abstract II万方数据 II 万方数据 Abstract Deep learning is a new research focus in the field of machine learning in recent years which originates from the Artificial Neural Network study. It simulates the multiple levels structure of the tte human brain. It can extract the essential features of the data through a multiple nonlinear transform of the bottom information and form a more abstract high-level expression. The research of speech recognition based on the combination of deep learning and multi-layer neural network will be more theoretical significance and practical value. This paper firstly explains the basic principle of speech recognition and the Hidden Markov Model and reviews the traditional speech recognition methods. It also analyzes their advantages and disadvantages. Then it simulates the procedures of pre-emphasis, endpoint detection and feature extraction. This paper focuses on the research of multilayer neural network based on the deep learning. Then simulates the standard error back propagation (BP) algorithm and the improved BP algorithm. Through the comparison of the
显示全部
相似文档