新型ISD语音组合电路设计与应用.doc
文本预览下载声明
新型ISD语音组合电路设计与应用
现代电子、电器产品及设备的智能化水平不断提高,在人机界面设计上不但有了文字标识、发光管指示、显像屏显示等视觉表达,而且还有各种听觉表达,如最简单的“滴滴、嘟嘟”讯响声、稍丰富些的音乐声,甚至用人的语言直接对用户“说话”等。用简单的数码语音集成电路可以实现一句或多句语言的播放,如掩模芯片中的“欢迎光临”、“有电危险、请勿靠近”等,还有如ISD系列、APR9600(IVS1560)等芯片可由开发人员或用户任意录制、播放需要的一段或几段语音等。在听觉表达中最复杂的就是语音的组合,它是将用户预存的多段语音选择顺序连续播放,将字或词素组合成一句话、甚至一段话播放出来,从而实现最准确、定量的语义表达,例如“嘟,现在温度37.5度,温度偏高”、“现在时间五点二十五分三十三秒”等。
传统语音组合电路的设计十分复杂,开发工具十分昂贵,语音录制及软件编制工作量巨大,而且组合出来的语音效果也不甚理想,尤其在投资不大的产品、系统中最为突出,从而制约了这一技术的应用和发展。只在近一、两年来,模拟存储语音技术的ISD芯片及其廉价的开发编辑工具问世后,情况才大为改观。现在已有专业公司开发出通用ISD语音组合模块,用户只需要在ISD语音芯片中分段录入要求的词素,即可方便地用单片机控制输出这些词素的任意组合成句、成段,词素的语音容量从20秒至480秒甚至更长,以至可以容纳所有的中文汉字发音,详见 http:// 。下面介绍一种用途最广泛的通用语音组合模板的设计与应用。
一、原理
ISD1420是采用模拟存取技术集成的可反复录放的20秒语音芯片,掉电语音不丢失,最大可分160段,最小每段语音长度为125ms,每段语音都可由地址线控制输出,每125ms为一个地址,由A0-A7八根地址线控制,地址语音控制表如表(一)所示。用户录制的语音每一段结束后芯片自动设有段结束标志(EOM),芯片录满后设有溢出标志(OVF),一片分段录好音的ISD1420芯片语音地址结构如图(一)示意。如果用单片机等控制电路按某一段的起始地址进行放音操作,遇到段结束标志(EOM)即自动停止放音,单片机收到段结束标志(EOM)就开始触发下一段语音的起始地址,如此控制,即可以将很多、不同段的语音组合在一起成一句话放音出来,实现语音的自动组合。
用户可以先通过专用的ISD1425语音编程拷贝机将需要的语音分段编程、连续录制到芯片中,每段语音的长度不限,制成语音源片后,将源片的录音端封住不让其再做录音操作,再由单片机电路控制放音。首先,单片机将ISD1420语音芯片完整搜索一遍,自动找出每一段的起始地址,按分段顺序编号存入外置的串行存储器中;然后用户通过单片机串口发出指令,单片机即将这些段的编号、地址一一调出,依次向语音芯片发出首地址——放音该段——该段结束,单片机收到EOM标志——单片机发出下一段语音的首地址——放音该段——如此工作,直到要求的一句话合成完毕。
这种控制方式有较强的通用性和方便性,它不需要事先规定每段语音的时间长度、总段数,甚至不需要知道每段语音在ISD1420芯片上的具体地址,只要用户记住录入语音的段顺序即可控制各段语音的自由组合。
十进制
地址数 二进制
A7 A6 A5 A4 A3 A2 A1 A0 ISD1420
(秒) 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0.125 2 0 0 0 0 0 0 1 0 0.25 8 0 0 0 0 1 0 0 0 1.0 10 0 0 0 0 1 0 1 0 1.25 50 0 0 1 1 0 0 1 0 6.25 100 0 1 1 0 0 1 0 0 12.5 159 1 0 0 1 1 1 1 1 19.875 160 1 0 1 0 0 0 0 0 溢出标志 表(一)ISD1420地址语音表
二、电路结构
图(二) ISD1420语音组合电路图
图(二)的电路图可以很好地实现语音组合。由于其中包含了大量最新的器件和技术成果,如可更换、反复使用的先进数字语音录放芯片(ISD1420),控制灵活功能强大的片内可擦写程序存储器的微型单片机(AT89C2051),非易失大容量I2C串行存储器24C16,低压差微功耗的三端稳压器(HT7251)使输入电源电压范围扩至5-12伏,平衡输入单端输出的LM386
显示全部