开题报告语音识别系统中的快速搜索算法研究.doc
文本预览下载声明
PAGE
北方工业大学
本科毕业设计(论文)开 题 报 告 书
题 目: 语音识别系统中的快速搜索算法研究
指导教师 :
专业班级:
学 号:
姓 名:
日 期: 2013年3月4日
一、选题的目的、意义
我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行 HYPERLINK /view/2265247.htm \t _blank 国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有???己的特点与优势,并达到国际先进水平。
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是将人类的语音中的词汇内容转换为计算机可读的输入,例如,二进制编码或者字符序列。语音识别技术的应用可以分为两个发展方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,如手机上的拨号、汽车设备的语音控制、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现。
嵌入式孤立词识别是小型化、便携式语音识别方向的应用热点,拥有较好应用成果,若在此基础上,开发大词量孤立词语音识别系统或中等词汇量连续语音识别系统,不仅使语音识别系统的应用范围扩大,而且令用户得到更好的语音识别体验。搜索时间消耗与词量成正比,为在识别率和识别速度之间寻求合适的平衡点,必须提升系统性能。任何电子设备(系统)都是由硬件部分和软件部分组成的,所以只要改进这两部分就能提升成品的性能,但是由于嵌入式平台的苛刻性,即计算机性能和内存资源受限,所以只能考虑改进软件方面,即精炼、修改解码算法,从而提高搜索速度。
二、本题的基本内容
从语音识别技术诞生以来,识别率就是评价语音识别系统的一个重要指标,随着语音识别技术的实用化,识别系统的速度也成为了和识别率一样重要的评价系统的重要指标,我们都知道,语音识别系统的精度和速度是一对互相矛盾的参数,那么如何能在尽量不影响识别率的前提下提高速度指标是本文研究的一个重点。
本文搭建的语音识别系统基于隐马尔可夫模型(HMM)。HMM 语音识别的基本原理如图 1所示。
帧同步维特比束搜索(Time Synchronous Viterbi Beam Search)是目前基于HMM(隐马尔可夫模型)的语音识别所广为采用的方法。对于孤立词语音识别,帧同步维特比束搜索的时间消耗与词表规模近似成正比。当词表规模增大到一定程度时,Viterbi搜索将成为识别算法的主要时间消耗因素。所以本文针对Viterbi搜索,部分进行了优化算法的研究。基于观察矢量与孤立词识别网络单向有序对应的特点,本文提出了一种基于自动音节切分的束搜索算法。
本文先描述了一下该理念的理论基础,因为待识别语音得到的观察矢量是一个线性序列,则该网络Q与观察矢量序列E是单向对应的,进行Viterbi搜索时,若只保留观察矢量序列E的对应段Q,其余路径不予计算, 则可实现基于音节切分的束搜索。该方法无需对路径排序即可实现音节层的剪枝。而后很大的篇幅在讲述本文的重点内容即自动音节切分的束搜索算法的实现,实现的过程概括的分为四步:
1)搜索之初,初始化搜索范围即对语音进行切分;
2)对每个音节进行判定,得出分数;
3)将所得分数进行归一化处理;
4)将所得词条与模板一一比对,得出结果。
最后将束搜索算法植入预先准备的语音识别系统里,测试束搜索算法的性能,为准确比较束搜索算法的时间性能,测试中不包含特征参数提取、输出概率计算等公共时间开销。三、完成期限和主要措施
第 1周: 收集资料
第 2周: 文献翻译
第 3周: 撰写开题报告
第 4周: 开题答辩
第5~6周: 制定实施方案
第 7周: 电路设计,编程
第 8周: 中期答辩
第9
显示全部