长途汽车站语音播报系统的设计与实现.doc
文本预览下载声明
长途汽车站语音播报系统的设计与实现
摘要:详细介绍了一种长途汽车站语音播报系统的设计与实现方法,实现了将文字实时动态转化为语音的信息管理系统的开发。对提高现代化长途汽车站的管理水平,具有一定的借鉴意义。
关键词:长途汽车站;文本语音转换;软件开发
中图分类号:TP391文献标识码:A 文章编号:1009-3044(2008)22-817-02
The Designment and Implementation of Broadcasting with Sound for Long Distance Bus Station
DING Ru-gen,CHEN Zhi
(Computer and information school,University of Hefei Polytechnology, Hefei 230009,China)
Abstract:This paper introduces a method of design and implementation of broadcasting with sound for long distance bus station. This management information system is developed to transform text into real-time speech dynamically. This paper is helpful for improving management level of modern long distance bus station.
Key words:long distance bus station; text to speech; software development
1 引言
语音合成技术的研究成果已经有很多,在许多领域中已有大量的应用。但是在很多地、市级的长途汽车站的候车大厅中,仍然采用的是人工进行广播,人工广播不仅难以及时准确,而且播报员的劳动强度很大。在春运高峰期间,班次信息不仅量大而且变化也快,播报员每天的工作量将更大,尤其对于班次检票、发车以及班次停运等的广播信息,很难及时而又准确地进行播报。为此,开发了一套长途汽车站语音自动播报系统,能够在长途汽车站的候车大厅中根据售票管理系统中的班次信息自动进行播报,提高了长途汽车站的现代化与信息化的管理水平。由于实现了语音自动播报功能,同时也节约了成本,给车站带来了一定的经济效益。当然,实现长途汽车站语音自动播报功能的前提条件是汽车站必须已使用了微机售票管理信息系统。
语音合成技术大致可以分为两大类:一类是意群语音,另外一类是文字语音。意群语音是指根据事先估计可能使用到的话音进行录制,并且将这些话音信息存储起来形成语料库。所谓语料库,就是指存储基本语音信息的信息库。在需要使用的时候可以从语料库中调出进行播放。文字语音是以文字为基本单位做好语音库,需要发音的每一个字符都可以在语音库中找到对应的语音信息。利用它可以实时动态地将文字信息转换为声音。这方面的研究成果以Microsoft公司研制的TTS技术(Text To Speech)最为杰出。如果需要使用中文进行发音,在利用TTS的技术中,同时需要下载支持中文语音库的补丁(Language Pack)即可。
2 系统分析
针对长途汽车站候车大厅中语音播报的特点进行分析之后,决定采用意群语音技术来实现自动语音播报。通过事先录入好的语音信息保存到语料库中,需要使用的时候调出进行播放。具体来说,将这个功能拆分成两个部分:(1) 整段句子录音保存到语料库中,需要使用的时候,将语音文件整段调出进行播放。例如:旅客乘车注意事项、公告信息等。(2) 部分单词、词语或句子进行录音形成音频文件,再通过音频编辑软件(例如:cooledit)进行编辑,然后保存到语料库中。在使用的时候,将单词或词组对应的语音信息合成后进行播放。例如:班次开始检票、停止检票通知的播报等。就是先在班次发车信息库中检索出班次的文本信息,根据文本信息从语料库中找到对应的语音信息,再将这些语音信息进行合成,然后进行播报。从而实现了长途汽车站候车大厅中的动态语音播报系统。
系统开发采用的前台工具是PowerBuilder,后台是SQL Server 2000数据库管理系统,音频编辑工具采用的是cooledit。音频采样率是16KHZ,量化精度为16位。
3 系统设计
3.1 声音信息的录入
在系统分析之后,就需要准备对声音文件的录入工作。声音文件的录入主要包括两个部分。下面分别进行说明:
整段语音文件的录入,主要针对旅客乘车注意事项、公告
显示全部