文档详情

语音信号处理第2章.ppt

发布:2025-01-27约4.07千字共32页下载文档
文本预览下载声明

想说阶段:人的说话首先是客观现实在大脑中的反映,经大脑的决策产生了说话的动机,接着讲话神经中枢选择恰当的单词、短语以及语法规则的组合,以表达他想说的内容和情感。这个过程与大脑中枢的活动有关。说出阶段:由想说阶段大脑中枢的决策,以脉冲形式向发音器官发出指令,另舌、唇、额、声带、肺等部分的肌肉协调的动作,发出声音。传送阶段:说出来的话语是一连串声波,凭借空气为媒介传播到听者的耳朵里。这阶段中,主要是传送信息的物理过程起作用。接收阶段:从外耳收集到的声波信息,经中耳的放大作用传到内耳。经过内耳基底膜的振动,激发柯替氏器官内的神经元使之产生脉冲,将信息以脉冲形式传送给大脑。该过程主要与听觉系统的活动有关。理解阶段:听觉神经中枢收到脉冲信息后通过一种至今尚未完全了解的方式,辨认出说话者及其所说的信息,从而听懂了讲话者的话。*三大系统:在声门以下,称为“声门子系统”,负责产生激励振动,是“激励系统”;从声门到嘴唇的呼气通道是“声道系统”;语音从嘴唇辐射出去,所以嘴唇以外是“辐射系统”*2.1概述2.2语音和语言2.3汉语语音学2.4语音生成系统和语音感知系统2.5语音信号生成的数学模型2.6语音信号的特性分析语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。01目的:02通过处理得到一些反映语音信号重要特征的语音参数以便高效的传输或储存语音信号信息;03通过处理的某种运算以达到某种用途的要求,例如人工合成出语音、辨识出讲话者、识别出讲话的内容等等。042.1概述2.2语音和语言人们讲话时发出的话语叫语音,它是一种声音,具有称为声学特征的物理特性。语音(Speech)是声音(Acoustic)和语言(Language)的组合体。可以这样定义语音:语音是由一连串的音组成语言的声音。人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段2.2语音和语言人的说话的过程:语言是从人们的话语中概括总结出来的规律性的符号系统。包括构成语言的语素、词、短语和句子等的不同层次的单位,以及词法、句法、文脉等语法和语义内容等。语言学是语音信号处理的基础。01语音学(Phonetics)是研究言语过程的一门科学。它考虑的是语音产生、语音感知等的过程以及语音中各个音的特征和分类等问题。现代语音学发展成为三个主要分支:发音语音学、声学语音学、听觉语音学。022.2语音和语言语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。音调是指声音的高低,它取决于声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声音的长短叫音长,它取决于发音时间的长短。说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。2.2语音和语言任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。01元音:当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过,这种音称为元音。02辅音:呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素称为辅音。03发辅音时由声带是否振动引起浊音和清音的区别,声带振动的是浊音,声带不振动的是清音。042.2语音和语言决定元音音色的主要因素是舌头的形状及其在口腔中的位置(简称舌位)、嘴唇的形状(简称口形)等。元音的另一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(FormantFrequency)的位置和频带宽度(FormantBandwidth)。一般地说,就语音的基音频率而言是女声和童声高于男声,但是实验表明:区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。122.2语音和语言2.3汉语语音学汉语语音的特点:音系简单。这是指音素少、音节少。音节的结构也比较简单。由于清辅音多,而且多是弱清音,而且开口呼的音节占全部音节的一半以上,所以汉语语音听感上有清亮、高扬和舒服、柔和的感觉。有鲜明的轻重音和儿化韵,所以字词分隔清楚,语言表达准确而丰富。汉语的拼音方法汉语由音素构成声母或韵母。有时,将含有声调(汉语通常认为有五个声调)的韵母称为调母。由单个调母或由声母与调母拼音成为音节。汉语的一个音节就是汉语一个字的音,即音节字。由音节

显示全部
相似文档