数字语音处理_第一章.ppt
文本预览下载声明
(2)第二次重大变革产生于八十年代末。1988年欧共体13个国家数字移动特别工作组(GSM)制定了采用长时预测规则码激励的编码标准(13k bps RPE-LTP)。 1989年美国蜂窝通信工业协会(CITA)宣布了北美数字移动通信话音编码标准(8K bps矢量和激励VSELP)。从而确立了全球范围第二个传输网移动通信产业的崛起。 (3)第三次变革发生在世纪之交。以新兴的计算机因特网为基础的信息高速公路在全世界范围迅速发展。如何在INTERNET网上有效地传输话音成为产业界关注的焦点。IP电话将使因特网成为第三个话音通信传输网。目前IP电话所用的话音编码标准有G.723.1、G.728、G.729等。这些标准各有长短。人们正在努力研究适合IP电话的新的编码算法。低延迟、低码率、低复杂性、高音质的话音编码算法将是未来IP电话网络的奠基石。 2. 基础理论和算法方面 从以下方面进行: (1)语音产生的机理(发音)和感知机理(听) 涉及心理学、语音学、语言学、认知学、神经生理学等。 (2)将语音作为一种信号来处理 常用方法: 数字滤波器(FIR、IIR);快速付里叶变换(FFT); 线性预测编码(LPC);同态信号处理等。 新的方法:神经网络、矢量量化、子波变换等 3. 硬件方面 硬件系统主要体现在内存容量和计算速度上。语音信号处理器的运算速度一般为10~20MIPS(Million Instructions Per Second),有的可达50MIPS或100MIPS, 对语音识别要求的存贮量达到若干MB。 实时语音语音处理系统的两种实现方式: A.?主从式:主机内插上一块或多块DSP处理板。 B.?脱机工作方式:通用DSP芯片及辅助芯片构成。 数字语音处理及MATLAB仿真 张雪英编著 * 数字语音处理及MATLAB仿真 张雪英编著 * 数字语音处理及MATLAB仿真 * 课程总括 课程性质 1 课程目的和任务 2 课程重点 3 课程难点 4 课程性质 语音信号处理是通信、电子信息专业的选修课程,主要用于现代通信和电子信息领域,其主要前修专业基础课程为信号与系统和数字信号处理。 课程目的和任务 通过本课程的学习理解语音发声和听觉机理及其数字模型;掌握语音信号处理的基本概念、原理和方法,为以后的学习提供理论依据;掌握语音信号的短时时域分析和频域分析方法,并且能够用Matlab语言编程实现对实际语音信号进行的处理;熟悉语音信号处理的应用领域,并了解该领域的新理论、新技术和发展趋势,为今后的进一步学习和工作打下坚实的基础。 课程重点 语音信号的产生和语音信号数字模型。短时能量、平均过零率、自相关的意义,以及这些特征参量在语音信号中的应用,并且会用MATLAB实现。短时频域分析的两种解释以及实现、LPC的基本原理以及与语音模型的关系、自适应量化的PCM,自适应预测编码原理以及前馈和反馈的主要区别,另外增量调制中所造成的失真以及失真补偿。矢量量化原理、LBG算法以及实验。 课程难点 语音信号的产生和激励、端点检测和基音周期的估计、用数学公式来证明短时频谱是如何反映整个语音信号的频谱的、LPC方程组解法、自适应预测编码原理、LBG算法以及实验中的分帧和基音周期检测。 第1章 绪论 1.1 概述 1 1.2 语音信号处理的发展 2 1.3 语音信号处理的应用及新方向 3 1.4 语音信号处理过程的总体结构 4 1.5 MATLAB在数字语音信号处 理中的应用 5 语音信号处理是一门新兴的边缘学科,是语音学与数字信号处理两个学科相结合的产物。它和认知科学、心理学、语言学、计算机科学、模式识别和人工智能等学科有着紧密的联系。 语音信号处理的目的: 得到某些语音特征参数以便高效地传输或存储; 通过某种处理运算以达到某种用途的要求。 1.1 概述 语音信息的交换大致上可以分为三大类: (1)人与人之间的语言通信: 包括语音压缩与编码、语音增强等。 (2)第一类人机语言通信问题: 语音合成,机器讲话、人听话的研究。 (3)第二类人机语言通信问题:语音识别和理解 语音识别和理解:人讲话、机器听话的情况
显示全部