文档详情

科大讯飞5.0语音软件的安装和操作要领.pdf

发布:2017-05-20约5.45千字共6页下载文档
文本预览下载声明
朗读效果排名的话,是这样的(由高至低): a. neospeech liang b. 科大讯飞 小燕 c. neospeech lily d. neospeech hui e. 科大讯飞 小宇 科大讯飞电话语音识别 InterReco——应用开发及工具包 为了方便语音识别系统的开发,InterReco 提供了一系列的开发接口和应用工具,从而使得 应用系统的开发更加高效,主要包含如下: 一、应用开发接口 ·语音识别接口 语音识别接口是 InterReco 提供的最重要的对外接口,是应用开发人员使用识别引擎进行语 音识别开发所必需使用的接口。这个接口提供强大的功能,能够发挥 InterReco 语音识别系 统的优势,通过不同的并发编程模型简化编程复杂度,优化系统性能表现。 ·语法接口 语法编译管理接口提供 API 形式的语法编译和管理的方法,主要用来解决动态语法的编译、 加载、激活的过程。用户根据需要使用这些接口可以对自己的应用程序做出恰当的优化, 提高应用系统灵活性。语法管理接口允许用户管理和设置语法缓冲的策略。 ·端点检测接口 端点检测是语音识别一个重要的输入环节,该接口允许用户通过编程对端点检测的处理策 略,和语音识别引擎进行交互。 ·音频输入接口 该接口提供一套能够使用户把电话语音输入设备挂接到 InterReco 语音识别引擎的方法,包 含各种品牌的电话语音卡和麦克风。通过这个接口,能够消除输入设备的多样化带来的集 成复杂度,使得产品在音频输入方面具备优秀的可扩展性。 ·管理维护接口 该接口提供管理维护接口、日志接口、以及其他一些辅助接口。 二、应用优化方法 分析和优化在语音识别的开发、应用过程中扮演非常重要的角色,好的分析和优化工具往 往能够决定语音识别的应用是否能够成功。InterReco 2.0 中提供的主要分析优化方法有: ·分析识别效果 通过 Call-Log 纪录,使用分析工具分析统计,得出当前应用的总体识别率、语法内识别率 等重要技术指标。这些指标能够反映出当前语音应用的总体识别效果,同时也能够分析应 用中存在的问题。 ·识别优化 通过识别效果的分析,对识别的语音界面、识别语法、识别模型、系统参数进行优化,以 达到提高用户满意度,提升识别效果的目的。 ·自适应 分为无监督和有监督的自适应,识别系统在运行过程中会以一定的间隔对当前的应用场景 进行一次无监督的声学模型自适应,这种适应的内容包括:说话人特征自适应,包含口音 和方言;通道特征自适应,包含无线通道、VoIP 编解码通道;应用特征,包含词汇、环境 噪声等。 三、工具包 InterReco 提供了丰富的开发调试工具,能够在集成开发的过程中为用户提供全面有效的支 持。主要包含: ·识别演示程序 识别演示程序是一个基于对话框风格的 Windows GUI 界面,其主要功能是在 Windows 环 境下,为用户提供一个简便、友好的方式,使得用户能够使用麦克风完成基本识别功能, 或者使用离线识别功能,也可以设置一些系统参数验证其效果。 ·语法调试分析工具 用户来可以直接用文本而不是实际语音对于自己编写的语法进行分析和调试。主要功能有: 输出语法的所有定义范围、测试一个说法是否满足语法要求。 ·语法管理工具 管理语法缓存工具,可以使用该工具查看当前 InterReco 系统语法缓存的详细情况,还可以 使用该工具手工删除指定的语法缓存条目,该工具还提供了预先编译语法文件的功能。 ·用户词典工具 用户自定义词典工具。通过该工具,可以对输入词条列表生成发音,并保存为用户自定义 词典。 这些开发接口和工具包可以帮助合作伙伴更快速的将语音识别产品集成到各中应用系统 中,并作为合作伙伴在语音识别业务设计、调试和效果优化等各阶段的技术助手,帮助合 作伙伴更快速的开发成功的语音识别应用系统。 科大讯飞 5.0 语音软件的安装和操作要领 科大讯飞 5.0 语音软件(硬盘版),它是目前最好的语音朗读软件,小宇(男声)、小 倩(女声)的发音可与真人发音媲美,尤其是小宇(男声)磁性发音效果好,听起来很自 然。5.0 语音软件操作方便简单,只要把解说词的文本粘贴上去,点合成就可发音读了。下 面我就介绍科大语音 5.0 软件的安装及使用方法。 一、软件大小: 01 运行库 5.0 版(332MB ) 语音库(可先下载):02 小宇(男声)5.0 版(1.12GB) 03 小 倩 (女声)5.0 版(583MB )04 小燕(女声)5.0 版(1.67GB) 05 小琳(女声)5.0
显示全部
相似文档