文档详情

基于DL的孤立词语音识别研究及手机应用开发设计.docx

发布:2025-02-12约5.38万字共88页下载文档
文本预览下载声明

PAGE

PAGE

PAGE72

基于DL的孤立词语音识别研究及手机应用开发

摘要

语音识别一直是人工智能的重要研究领域。随着人工智能技术与机器学习方法的发展,语音识别领域也不断取得进展,尤其是近年来,以“深度模型”和“特征学习”为特点的深度学习(DeepLearning,DL)方法的出现,为语音识别带来了重大突破。其中,卷积神经网络(ConvolutionalNeuralNetwork,CNN)作为一种典型的深度学习模型,因其所拥有的局部连接、权值共享和下采样特点,使其具备了泛化力强,学习效率高等优势,在图像识别和语音识别领域均占据着重要地位。已有研究表明,许多研究者在声学模型的构建和特征提取均采用CNN来实现,获得较好的效果。

本文旨在研究基于CNN的孤立词语音识别方法,并设计开发出应用原型系统,主要做了以下工作:

(1)研究了语音识别的相关理论,阐述了语音的预处理、特征提取过程以及CNN网络的组成结构和误差前向后向传递机制;

(2)在卷积神经网络研究基础上,分析了CNN对语音特征进行特征提取的过程,构建用于孤立词语言识别的声学模型。针对构建好的声学网络模型进行训练,采用实验法对主要参数进行调节,分析每个参数对模型识别准确率的影响,最终确定一组最优的模型参数。

(3)设计并开发了应用原型系统,包括基于微信小程序的前端语音采集子系统,基于PythonFlask框架的后端服务子系统,以及基于TensorFlow实现的CNN语音识别模型。

(4)对开发的应用原型系统进行测试,邀请真人进行语音识别实验,实验结果表明,每个语料词的识别准确率均超过90%,整体识别准确率达到93%以上。

研究工作表明,基于CNN构建孤立词语音识别模型具有较好的识别效果,基于微信小程序+PythonFlask框架+TensorFlow工具箱实现孤立词语音识别应用系统是可行的,并有一定的实用价值。

关键词:孤立词语音识别;深度学习;卷积神经网络;微信小程序;PythonFlask架构

ResearchonIsolatedWordSpeechRecognitionBasedonDLandDevelopmentofMobilePhoneApplication

ABSTRACT

Speechrecognitionhasalwaysbeenanimportantresearchareaof??artificialintelligence.Withthedevelopmentofartificialintelligencetechnologyandmachinelearningmethods,thefieldofspeechrecognitionhasalsomadecontinuousprogress,especiallyinrecentyears,theemergenceofDeepLearning(DL)methodscharacterizedbydepthmodelandfeaturelearning.Amajorbreakthroughhasbeenmadeforspeechrecognition.Amongthem,ConvolutionalNeuralNetwork(CNN)isatypicaldeeplearningmodel.Becauseofitslocalconnection,weightsharinganddownsamplingcharacteristics,ithasstronggeneralizationandhighlearningefficiency.Advantages,occupyanimportantpositioninthefieldofimagerecognitionandspeechrecognition.StudieshaveshownthatmanyresearchersuseCNNtoachievetheconstructionandfeatureextractionofacousticmodels,andobtainbetterresults.

ThesisaimstostudytheisolatedspeechrecognitionmethodbasedonCNN,anddesignanddeveloptheapplicationprototypesystem,m

显示全部
相似文档