中图分类号:R852文献标识码:A文章编号:1002-0837(1999)01-0072-04
Effects of Noise on Speaker's Voice
GAO Hui
(Institute of Space Medico-Engineering,Beijing 100094,China)
ZHOU Du-qiangHUANG Duan-sheng
Abstract:Noise is one of the important factors which influence communication in aerospace and military environment.It influences listenning and speaking of the talkers during voice communication.The paper introduced the changes of acoustic-phonetic characteristics and intelligibilities of speech production under noise,and also introduced speaking duration in face-to-face communication under noise.
Key words:noise;language communication;influence
在航天和军事领域中,语言通讯常碰到一些特殊情况,说话人往往处在各种复杂环境中,如噪声、振动、低气压、超重、失重等,这使语音发生变化,从而影响语言通讯的质量。在环境因素对语音影响的研究中,由于噪声对通讯的影响最直接和显著,因而国内外学者对该问题进行了深入探索。研究主要从噪声对听话人和说话人两方面进行,对听话人影响主要以噪声掩蔽作用为主,而对说话人研究在四、五十年代研究重点集中在语音清晰度方面,从主观听觉感受进行探索;之后随着语音技术的发展,声码技术和语音识别技术在各个领域广泛应用,噪声环境下语音特征的改变影响语音技术的应用,因而70年代以后,研究人员将目光转向更为细微的语音特征的影响上,为语音技术在多领域的应用奠定理论基础。本文从语音特征、语音清晰度、面对面通讯的交谈可持续时间三方面综述环境噪声对说话人的影响。
噪声作用下的语音特征变化
噪声不但在听觉感知上可产生掩蔽效应,同时对语音生成也会产生影响。早在1911年,法国医生Etienne Lombard便定性描述了听与说之间的某种动态关系。他做了一个实验,让病人在通常安静情况下对话,然后在谈话场所引入强的背景噪声,此时发现病人会立即提高声音,当停放噪声时,病人说话音量又会恢复到从前。同时他还发现在有神经性耳聋的病人中说话嗓音也很高。Lombard认为说话噪音的提高由环境噪声强度的提高引起,该现象后被称作Lombard效应。
此后研究人员对Lombard效应进行了广泛研究,发现当讲者和听者间的距离增加和背景噪声强度提高时,说话人的语音强度都会自动提高。Kryter[1]和Pickett[2] 的研究发现在有较强的背景噪声下,面对面通讯,环境噪声每上升10 dB时,语言信号强度提高3 dB。Webster和Klumpp[3] 则报道每10 dB的噪声强度提高带来了语言信号5 dB的改变。Pearsons和他的同事[4] 在研究距离1 m的面对面直接通讯中发现背景噪声在48~70 dB间变化,每上升10 dB,语言声级提高6 dB。在Summers[5]等人的研究中采用80 dB、90 dB、100 dB三种强度的白噪声作为环境噪声,实验结果表明,发音的平均能量值在有环境噪声下均有提高,提高的程度因人而异,但方差分析表明都具有非常显著的变异性;在Bond.Z.S[6]等人的研究中,采用95 dB的粉红噪声作为环境因素,为模拟航空通讯环境,在实验中他们让被试者佩戴AF标准飞行头盔和供氧面罩,以研究噪声对发音的影响。实验结果表明在粉红噪声背景下,不佩戴供氧面罩时,语音总的平均能量仍有明显提高; 佩戴供氧面罩条件下,背景噪声的影响与安静时相比,语言声能量变化不显著。从上述结论可以看出尽管各研究学者由于实验条件各不相同,语言强度的提高程度也有差异,但背景噪声的出现促使说话人自动提高发声用力程度(vocal effort),造成语言信号强度的提高是不容质疑的。
随着Lombard效应的深入研究,还发现背景噪声除了改变发声的强度外,还对语音的其它特征参数有影响。如时长、基频等参数。在Webster和Klumpp的研究中发现说话时背景噪声强度提高会使说话速度放慢; Summers等人及其他一些学者 (Land和Tranel[7,8])发现噪声中产生的单词发音的时长及元音时长都有所增加,但同时也有一些研究没有得到类似结果,如Bond.Z.S等[6]人的研究只得到了在第二个音节的元音时长有显著加长的结果。对于基频变化的研究,各学者间的研究结果是一致的。 Draegert[9]、Lane和Tranel及Summers等人的研究中都证实噪声环境中发音会使基频提高。Shulaman[10]提出基频F0的显著提高是由于努力发声时声门下压和喉肌紧张程度造成,从生理变化的机理高度对F0提高进行了解释。
在对Lombard效应的几十年研究中注意力多集中在上述语音强度、时程、基频这些韵律特征上,对于语音频谱特性,及更细微的元音共振峰特性的研究很少,随着近几年来语音技术的发展,主要是针对自动语言识别系统在航天航空及军事领域的应用为目的,人们开始对语言声学特征进行更为全面的研究。在研究韵律特征的同时,也在探寻共振峰频率、谱的能量分布的变化规律。Pearsons指出尽力发声时,能量向高频段移动;在Shulaman的研究中得到了共振峰F1提高的结果。在Summers的研究中不但验证了在背景噪声下强度、时长及基频特征的改变,同时也研究了共振峰及能量谱分布的变化。文中指出元音共振峰的改变受发音人的个体差异影响大,发音人MD的发音平均共振峰F1、F2 都有轻微下降,另一发音人SC的平均F1显著提高,F2的变化与发音内容有关,具有较低的F2的发音在100 dB背景噪声下提高,而具有较高F2值的发音会降低;此外还得到了对谱的倾斜趋势有显著减弱的结果,而且在100 dB下谱倾斜趋势明显低于80 dB,即噪声的出现使说话人的语言频谱变得平坦,能量在高频部分分布的增加使得谱倾斜趋势减弱。Bond.Z.S等[6]人对四个元音/i,ae,a,u/的共振峰进行了研究,其结果表示在图1上,从图中可以看出在 95 dB的粉红噪声下四个发音的F1提高,F2的变化与单词有关,只有元音/i/和/u/的F2发生变化,/i/的F2下降,/u/的F2上升,而/a/和/ae/的F2变化不大。由于/i/的F2的标准值大,/u/的F2 的标准值小,因而也体现了高的F2降低,低的F2提高的规律,这与Summers 的研究结果是一致的。由上述研究结果可知,共振峰F1,F2在噪声下的改变不像韵律特征那样明显,它们的变化与发音人及发音内容有关。
图1F1·F2元音图
Fig.1F1·F2 vowel
注::安静状态;---:噪声状态
Note::quiet condition;---:noise condition
噪声作用下语音清晰度的变化
对噪声下生成语音的清晰度的研究,也是人们非常关注的。在Draegert、Dreher 、Summers等多人的研究中皆得到了噪声环境可显著提高语音清晰度的结论,同时噪声环境影响与测试清晰度实验的环境信噪比有关,随着信噪比的降低,背景噪声对语音清晰度的影响会突出体现出来; 噪声对清晰度的影响与说话人也有一定的关系,在Summers的研究报告中,在同样的信噪比下,其中一名说话人的清晰度得分皆高于另一发音人。由此可见,噪声引起的语音特征的变化会反应到对生成语音的主观感知上。这是由于当说话环境中出现噪声时,混杂噪声的话音通过体外反馈到人的中枢神经系统,使人意识到自己的话音已被干扰,从而会影响到他人对自已所说言语的感受与理解,因此发音人会自动调节自己的发音,提高发声努力程度,尽力保证发音清晰,以使噪声环境下也能听懂他的语言。
上述清晰度的改善及有关声学特征的变化与清晰发音的研究结果有相似的地方。在清晰发音(clear speech)方面,Picheny[11]等人作了研究,所谓清晰发音,是给说话人以指令,要求其在通讯中清晰吐字,发音更慢声音更大些,这种说话人有准备的调整使发音的时长、平均能量、F0都提高,语音清晰度被改善,这些变化与噪声的影响是一致的。但其清晰度的提高比噪声下语音的清晰度提高程度更为显著,Mosko[12]曾对两者进行了对比,指出清晰度在清晰发音条件下提高16%至18%,而噪声环境下只有6%至8%的改善。同时共振峰的变化是有区别的,Chen指出F1、F2 的变化使元音空间扩大,因而使不同发音的共振峰差别更为显著。这说明噪声的影响并不等同于清晰指令的作用。但可以预见,若在噪声环境下要求讲者保证清晰发音,对通讯效果是会有改善的。
另一方面,噪声下的发音并不总能带来令人满意的结果。由于上述发音人的主观努力,会使得清晰度提高。但是,在发音人竭力呼喊时,情况<
