文档详情

科大讯飞MSC开发指南-iOS-01230959.pdf

发布:2019-03-23约6.91万字共68页下载文档
文本预览下载声明
目 录 概述 集成流程 语音合成 语音听写 语音翻译 AIUI语义 个性化识别 语法识别 声纹识别 语音评测 语音唤醒 人脸识别 身份验证 (人脸+声纹 ) 附录 FAQ 本文档使用 看云 构建 - 2 - 概述 概述 本文档是开发者集成科大讯飞MSC (Mobile Speech Client ,移动语音终端 )iOS版SDK的 使用指南 ,定义了语音听写、语音识别、语音合成、语义理解 ,语音评测、语音唤醒 ,人脸 识别等服务接口的使用。关于各服务接口更详细的说明 ,请参考 MSC iOS API 文档。在集 成过程中如有疑问 ,可登录语音云开发者论坛 ,查找答案或与其他开发者交流。 1. iOS语音SDK概述 MSC SDK的主要功能接口如下图所示 : 2. 业务描述 为了更好地理解后续内容 ,这里对文档中出现的若干专有名词进行解释说明 ,更为详细的信 息可查看官网文档(http///doccenter/)中的语音服务部分。 名词 解释 将一段文字转换为成语音 ,可根据需要合成出不同音色、语速和语调的声音 ,让机器像 本文档使用 看云 构建 - 3 - 概述 人一样开口说话。 将一段语音转换成文本 ,把语音中的文字信息提取出来 ,并可以优先识别用户手机特有 语音听写 的联系人和个性化数据。 判断用户所说的内容是否与预定义的语法相符合 ,主要用于识别用户是否下达某项指 语法识别 令 ,使用语法识别前 ,需要先定义语法。 在语音听写基础上 ,分析理解用户的说话意图 ,返回结构化的指令信息。开发者可在 AIUI语义 AIUI开放平台定义专属的问答格式。 语音评测 通过智能语音技术自动对发音水平进行评价 ,给出用户综合得分和发音信息。 即设备 (手机、玩具、家电等 )在休眠 (或锁屏 )状态下也能检测到用户的声音 ,并根 语音唤醒 据声音提示进行相应操作 ,开启全语音交互 ,同时支持唤醒+识别、唤醒+语义的 OneShot方案。 在本方案中 ,开发者可根据应用场景灵活的选择身份验证方式 ,如单人脸验证、单声纹 验证以及人脸+声纹的融合验证方式。这样既解决了单生物特征识别暴露的局限性 ,也 身份验证 提供了更精准、更安全的识别和检测方案。身份验证方案还会持续增加更多的常用特 征 ,达到更广泛的市场应用前景。 本文档使用 看云 构建 - 4 - 集成流程 集成流程 第一步 :获取appid 第二步 :工程配置 添加库 设置Bitcode 用户隐私权限配置 第三步 :初始化 **AIUI初始化** **添加AIUI结果解析文件** 第四步 :启动服务 第一步 :获取appid appid是第三方应用集成讯飞开放平台SDK的身份标识 ,SDK静态库和appid是绑定的 ,每款 应用必须保持唯一 ,否则会出现10407错误码。appid在开放平台申请应用时可以获得 ,下 载SDK后可从SDK中sample文件夹的Demo工程里找到 (例如 /sample/MSCDemo/MSCDemo/Definition.h 的APPID_VALUE ) 第二步 :工程配置 添加库 将开发工具包中lib目录下的iflyMSC.framework添加
显示全部
相似文档