多媒体素材采集与处理实验教学指导书.pdf
多媒体素材采集与处理实验教学指导书
一、实验目的:
学会使用扫描仪获取书页影像并将之转换为电子文档;掌握图像、音频多
媒体素材的采集与编辑方法。
二、实验内容:
1.学会使用扫描仪扫描影像的方法。
2.掌握扫描软件Scanwizard5、OCR软件尚书七号的使用
3.掌握在Windows环境下录制、播放与编辑声音文件的方法。
4.掌握Goldwav音频录制与编辑技巧。
三、实验仪器设备:
MicroteckScanMaker3860扫描仪、计算机、耳麦。
四、实验原理:
扫描仪是一种获取影像的装置,并将之转换为计算机能够显示、编辑、储存
与输出的数字格式。这里所说的影像是指照片、文字页、图形与插画等,甚至如
硬币或者纺织品等三维物件都算是影像的一种。实际上,这意味着扫描仪能够完
成下列工作:
在文件中结合美术图形与照片。
将印刷文字扫描输入到文书处理软体中,免去重新打字。
将传真文件扫描输入到数据库或者文书处理软体中储存。
在多媒体中加入影像。
在摘要中结合影像资料使其能更有效的表达主题。
扫描仪可区分为两种类型:
平台式扫描仪,用来扫描照片与印刷品.平台式扫描仪都具有一个玻璃面,
用来摆放扫描稿件。
透射式扫描仪,用来扫描幻灯片与底片。
在我们实验中使用的中晶MicroteckScanMaker3860是一种典型的平台式
扫描仪。
在扫描系统中,扫瞄仪仅是构成整个系统的其中一部份,除了扫描仪以外,还
需要其它的组件:①一条特定的连接线,连接扫描仪与电脑。②操纵扫描仪工作
的扫描软件。③用影像编辑软件将扫描影像结合到您的工作中;或者用文字辨识
软件将扫描文字结合到您的工作中。④一个合适的屏幕用来显示彩色或者灰阶影
像。⑤用来输出您工作成果的输出设备,如印打印机。
工作原理:对原稿进行光学扫描,然后将光学图像传送到光电转换器中变为
模拟电信号,又将模拟电信号变换成为数字电信号,最后通过计算机接口送至计
算机中。
扫描仪扫描图像的步骤是:首先将欲扫描的原稿正面朝下铺在扫描仪的玻璃
板上,原稿能够是文字稿件或者者图纸照片;然后启动扫描仪驱动程序后,安装
在扫描仪内部的可移动光源开始扫描原稿。为了均匀照亮稿件,扫描仪光源为长
条形,并沿y方向扫过整个原稿;照射到原稿上的光线经反射后穿过一个很窄的
缝隙,形成沿x方向的光带,又通过一组反光镜,由光学透镜聚焦并进入分光镜,
通过棱镜与红绿蓝三色滤色镜得到的RGB三条彩色光带分别照到各自的CCD上,
CCD将RGB光带转变为模拟电子信号,此信号又被A/D变换器转变为数字电子信
号。至此,反映原稿图像的光信号转变为计算机能够同意的二进制数字电子信
号,最后通过串行或者者并行等接口送至计算机。扫描仪每扫一行就得到原稿x
方向一行的图像信息,随着沿y方向的移动,在计算机内部逐步形成原稿的全图。
人耳的听觉特性涉及生理声学与心理声学方面的问题。人耳可听的声音频率
范围为20Hz至20KHz,但人耳对不一致频率的声音敏感程度是不一样的,中频
段(3kHz~5kHz)最敏感,幅度很低的信号都能被人耳听到。低频区与高频区
较不敏感,能被人耳听到的信号幅度比中频段要高得多。
话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连
续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多
个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间与幅度上都是
连续的信号称之模拟信号。
声音数字化就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字
计算机进行处理,要紧包含采样与量化两个方面。数字化音频的质量取决于采样
频率与量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次
数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音不失真,
采样频率应在40kHz左右。经常使用的采样频率有11.025kHz、22.05kHz与
44.lkHz等。采样频率越高,声音失真越小、音频数据量也越大。量化数据位数
(也称量化级)是能够用来表示每个采样点的数据范围,经常使用的有8位、12
位与16位。比如,8位量化级表示