文档详情

数字音频的采集与处理..doc

发布:2016-12-19约4.81千字共6页下载文档
文本预览下载声明
数字音频的采集与处理 一个多媒体系统,如果仅仅是文本、图像、视频和动画的结合,而没有背景声音、音乐等演播支持,即使是五彩缤纷的多媒体演示也会因无声无息而变得十分平淡。在多媒体课件中,适当地运用声音能起到文字、图像、动画等媒体形式无法替代的作用,如调节课件使用者的情绪,引起使用者的注意等。当然,声音作为一种信息载体,其更主要的作用是直接、清晰地表达语意。 本章对多媒体pc机中的数字音频部分进行有关介绍,并就音频处理的问题,为大家介绍一些简单的使用操作方法。 第一节 数字音频基础 1.1 数字音频知识简介 1.基本概念 声音本质上是一种机械振动,它通过空气传播到人耳,刺激神经后使大脑产生一种感觉。在一些专业场合,声音通常被称为声波或音频。 声音是物体的振动产生的。物体的振动引起空气的振动,传到人的耳朵以后引起耳膜的振动,通过听觉神经传到大脑,使人听到了声音。这个过程中首先需要振动源(就是发声的物体),同时需要传播振动的介质(在真空中声音是不能传播的),然后才是接收声音的人耳。如果用一个话筒来代替人耳,使得声音的振动转化成电信号,以电信号电压的变化表示声音的变化,这就是模拟音频信号;普通物理学告诉我们,磁和电是一对亲密无间的好兄弟,模拟音频信号可以转化成磁信号,而磁信号可以存储在磁带中,还可以转化成机械轨迹固化在唱片中,这就是模拟音频的录制;在一定的条件下,我们把磁带里的磁信号和唱片里的轨道信号转换成机械振动,再次通过空气来传播,这就是模拟音频的重放。关于模拟音频,就说这几句,说得很简单,对于我们学音乐的朋友,就这样吧! 在电脑里面,一切信息都转化成数字(不是我们熟悉的十进位制数字,而是由无数个0和1组成的二进位数字),声音信息也不例外。要把连续变化的的模拟音频信号转换成间隔断续的(即离散的、不连续的)数字信号的数列,就产生了两个问题,也就是数字声音的两个基本参数:采样和量化。 大家知道,声音是一个随着时间的变化而不断变化的流动过程。我们可以用一个示意图来表示声音波形的一个片段。如下图,横向代表时间的过程,往右是时间的增加;纵向代表声音的强弱,往上是声音振幅的增加。  大家可以看到,在横向时间的每一瞬间变化都会引起声音振幅的变化,实际上这是一个连绵不断的过程,我们不可能将所有的变化全都用数字记录下来,只能是在时间轴上每隔一个固定的时间在声音波形曲线上抽取一个点进行一次取值,称为“采样”。采样频率就是每秒钟抽取的点的个数。显然,抽取的点的数量越多越密,取值的结果就会和真正的声音越一致,也就是说采样频率越高音质就越好越真,但是生成的电脑文件的“个头儿”也就越大,所以凡事都得有个限度。技术上常用的采样频率是以下3种:每秒11025次、每秒22050次和每秒44100次,分别标记为11.025KHz、22.5KHz和44.1KHz。 同样的,在纵向轴上每一瞬间声音振幅的大小也具有无穷多的可能性,也不可能完全都记录下来。我们只能将一定幅度以下的数值变化予以忽略,只用一个数字表示。这就叫做量化。量化位数就是2的平方数字,例如量化位数为4,就是24=16;量化数字为8,就是28=256;量化位数为16,就是216=65536,将声音幅度分为65536份。这已经是很细的划分了,对声音的描述非常精确,远远超过了人耳所能辨别的精度。 一个采样频率,一个量化位数,这就是数字音频的两个基本性质,或者说两个基本参数。实践中还有一个声道数:单声道、双声道还是更多声道,很好理解,就不多说了。 众所周知,计算机只能处理数字化的信息。声音也不例外,自然的声音振动或用模拟信号表示的声音,都需经过数字化处理才能在计算机中使用。 计算机中广泛应用的数字化声音文件有两类:一类是专门用于记录乐器声音的MIDI文件;还有一类是采集各种声音的机械振动而得的数字文件(也称为波形文件),其中包括乐器的数字音乐、数字语音及数字化的自然界的效果音(音效文件)等。 2.数字音频处理 大家知道,无论现在的多媒体电脑功能如何强大,其内部也只能处理数字信息。而我们听到的声音都是模拟信号,怎样才能让电脑也能处理这些声音数据呢?还有,究竟模拟音频与数字音频有什么不同呢?数字音频究竟有些什么优点呢?这些都是我们下面所要介绍的。 把模拟音频转成数字音频,在电脑音乐里就称作采样,其过程所用到的主要硬件设备便是模拟/数字转换器(Analog to Digital Converter,即ADC)。采样的过程实际上是将通常的模拟音频信号的电信号转换成许多称作“比特(Bit)”的二进制码0和1,这些0和1便构成了数字音频文件。如下图,图中的正弦曲线代表原始音频曲线;填了颜色的方格代表采样后得到的结果,二者越吻合说明采样结果越好。 上图中的横坐标便
显示全部
相似文档