目录
1. 语音交流的基本过程
2. 发声的器官
3. 语音产生的机理
4. 数学模型
语音是人与人之间最自然、最有效的交流沟通方式,它不仅包含语音本身的内容信息还携带了说话者的喜怒哀乐。现代生活中,语音交流十分便捷,但是语音本身产生的原理却并不简单。
1. 语音交流的基本过程
语音交流的基本过程如下:
想法->句子->言语->声音->声波->---->声波->声音->言语->句子->想法
举个例子
——想法:现在已经11点半了,前面好像是Ryuk走过来了,要不一起吃个饭吧
——句子:嗨,你吃过了么?
——音素:/h/ /ai/ /n/ /i/ /ch//i/ /g//ou//l/ /e/ /m//e/
——声波:/h-ai/ /n-i//ch-i//g-ou//l-e//m-e/
2. 发声的器官
人的语音是在大脑控制下由发声器官产生的,发声器官包括:肺、气管、声道、咽、鼻、口等, 如下图所示。这些器官形成复杂的管道,其中喉称为声门,声门到嘴唇这一部分称为声道。在发声系统中,肺和气管提供发声的能源,由喉产生声音继而由声道对声音进行调制。(lip: 嘴唇,tongue: 舌头, hard palate: 硬腭, velum: 软腭, pharyngeal wall: 咽壁, epiglottis: 会厌, glottis:声门)
在上述器官构成的声音管道系统的支持下就可以发出声音了,上图的模型比较复杂,将它简化一下:
3. 语音产生的机理
语音产生的机理:
空气通过呼吸进入肺部,此时一般没有声音产生
空气经由气管从肺部排出形成气流,然后经过声带。
如果声带是绷紧的,那么声带将会产生振动,然后气流经过声道到达嘴唇产生浊音。
如果声带是松弛的,那么肺部空气不受影响经过声门。途中如果声道收缩,那么空气被加速送出形成摩擦音或者清音;如果声道直接闭合,那么空气在此处产生压力,当再次开启时产生爆破音。
我们把整个过程抽象一下,可以得到如下的模型,整个发声系统包含两种参数一种是激励参数,由肺部和气管控制;另一种是声道参数,由构成声道的气管控制。
4. 数学模型
发声模型由激励模型、声道模型和辐射模型级联组成,即
激励模型
发浊音时,激励信号是以基音周期为周期的斜三角脉冲串。单个斜三角脉冲将其表示为Z变换全极模型
周期性的三角脉冲可以表示为加权单位脉冲激励上述的单个斜三角脉冲得到,因此完整的激励模型为
发清音时可以简单的模拟为白噪声,这里就不再浪费笔墨了。
声道模型
声道模型目前可以分为两类,一类是将声道视为许多个横截面积不同的管道所组成,如图所示:
此时声道可由一组截面积或者一组反射系数来表示,面积差和比为:
其中Am表示第m段管道的横截面积。
另一类就是将声道模型视为谐振腔,共振峰就是这个谐振腔体的谐振频率。基于共振峰理论,共振峰模型可以分为级联型、并联型和混合型。其中级联型模型可以表示为:
并联型模型可以表示为:
混合型则是级联型和并联型的结合。
辐射模型
在发声模型的最后,辐射模型类似于一阶高通滤波器,可以表示为:
参考文献:
[1].胡航, 语音信号处理
[2].UCBS, Digital Speech Process
语音信号处理交流群: 652292630
如果觉得《声音产生的机理详解》对你有帮助,请点赞、收藏,并留下你的观点哦!