发烧论坛

注册

 

发新话题 回复该主题

关于人类听觉系统是如何对声音的定位进行判断的?(已有的部分结... [复制链接]

1#
人的听觉系统其实是一个非常复杂的系统,虽然目前关于声像定位判断的研究已经进行了几十年,也得到一些很重要的结论,但个人认为,仍然有很多值得研究的地方。

在此,只谈谈关于听觉系统对声音定位的一些已有的结论吧(有些还有待研究)。

首先说明,任何科学研究都是以最简单、最基本的现象作为研究对象的。因此,对于声像定位的研究,最开始就是研究只有一个声源,在空间中移动时,其声音传输到达双耳时是如何变化的,或者说,双耳接收到的信号在不同的声源位置时有什么不同。经过几十年的研究,目前声学界公认的主要结果如下:
1、影响人耳对声音定位的因素主要有2个:双耳时间差ITD(哈斯效应可以归属于这个方面)和双耳声级差ILD。双耳时间差指单个声源到达双耳的相对时间差。同理,双耳声级差指单个声源到达双耳的相对声级差;

2、基本上以1500Hz的频率为分界(但不是绝对的),低于这个频率,ITD对定位逐渐起主要作用,高于这个频率,ILD逐渐起主要作用。7002500Hz之间,ITDILD都有作用;

3、不同大小的人头,对声像定位的判断是不一样的,尤其是中高频。(所以,不要强求别人一定要听到跟你的声像感觉一样的东西)


然后,声学界开始对多声源(发烧友可以理解为多个扬声器)播放同一信号时,人耳的声音定位机理是怎么样的进行了相当多的研究,得到一些比较重要的定理,并由此促进了双通路(如目前广泛使用的双扬声器音响系统)乃至多通路立体声(利于DOLBY 5.1等)的发展。相关主要定理如下:


1、正弦定理:这个定理适应于人的头部不转动的情况。具体的公式就不介绍了,基本意义是:两个扬声器播放同一个信号并保持其相对延时为0,信号同相,则两个扬声器之间区域的声像定位角度(以水平面上的角度为例)可以通过改变两个扬声器的馈给信号的比例来完成,并且声像移动是连续的;

2、正切定理:这个定理适用于人的头部转动的情况,研究的系统的预设状况与正弦定理相同,只是两个扬声器的信号馈给比例有一点点不同。

3、不同的频率,声像定位的角度是不同的,因此,不可能完全重现出真实声源的大小。或者说,声像大小都普遍大于实际声源;

4、以上两个定理都只适用于低于700Hz1.5KHz的情况。幸运的是,目前大部分声音的基频都处于这个频段。

目前的双通路立体声的所有制作技术(包括录音技术)都是基于以上两个原理进行的,没有例外。

至于在两个扬声器之间区域之外的声像营造,则必须通过改变两个扬声器信号的相位、比例来完成。我们实验室(名字在这里就不公布了)在这方面也进行了相当多的研究,并且基本上(注意是基本上)可以用2个扬声器营造出包含±90度(即正左、正右)的声像。另,通过应有HRTF(人头相关传输函数),也可制作出许多虚拟的声音方向,目前很热的关于虚拟现实的研究,声音方面就基本上跟HRTF有关了。

在这里重复一下:科学研究的对象一般都从最简单的问题开始。所以,如果加上环境的干扰,则定位问题就变得非常复杂了,因为环境本身就是一个存在非常多变数的可变条件。所以目前这方面也没有相关的定论。

有趣的是,关于环境对声像影响的研究,目前仅在影响声像的大小(学界简称ASW)方面有比较多的研究,但只对有限的前几次反射声的强弱、强度、方向,对声像大小的影响进行了非常严谨的研究,但还没有得到非常明确的公认的结论。


另外有几个问题估计大家都是很感兴趣的,相关的研究结论如下:
1、关于声像的远近问题:
人对声像远近的认知主要通过环境完成。如果在消声室,没有了环境的影响,人对声像的远近的感觉就不那么明确了,只能通过判断声音的大小,或者是音色的改变(近距离低频会提升)来判断远近,但近多少?远多少?就不能判断准确了。当然,加了环境也不能准确判断远近了多少,但要比在消声室准确很多。所以,通过摆放扬声器的位置来获取相关的声场的感觉是很好的方法(这个在发烧界是大家都知道了);

2、关于人对声像高度的感知问题:
不同的人感觉是不一样的。但明确的是,人耳对水平面的声像位置判断比较准确,但对垂直面(也就是高度)是非常不准确的。因为在水平方向上人有2只耳朵,但在垂直上就只有1只,当然,耳廓的形状对分析高度还是有一定帮助的。

3、录音是否带有足够的空间信息来展现发烧界所经常讨论的声场的宽度和高度?
目前的录音技术,仍然广泛应用M/SA/BORTS等格式的录音技术,这些录音的技术都只能录制水平面的方向信息,是不含高度的方向信息的。那为什么有远近、高低的感觉呢,是因为这些录音都是经过环境的信号处理过程的(比如在实际的厅堂录音,就有厅堂的信息,如果是分轨录音,后期制作也要加入混响处理等,还有很多关于改变比例、改变音色等常规的混音技术处理等),加上人平时的听音经验的积累,就能感觉到了(注意不是真的)。

要注意的是,即使单声道的录音,也录制了从各个方向而来的声音,但这些不同的方向的声音,是混在一起了,不可能分开,也就是说不可能让来自后方的声音,从后方的扬声器播放。要想把方向分开,在录音时必须要使用话筒阵列,比如B-Format制式的话筒(38字型指向话筒装在X/Y/Z轴上,1个全指向话筒装在原点上),只有使用这种立体阵列的话筒,才可能录制包含上下左右的方向信息的声音,并通过特定的解码方式,才能还原不同方向的声音(可以从不同方向播放),达到真正还原空间立体声的目的。但可惜,这种技术由于扬声器系统在家里很难推广,而受到限制。

总的来说,双声道的扬声器系统,是不可能重现(指物理上)来自不同高度方向的声音的。发烧友所感知的不同乐器不同高度的信息,很多是基于本身对声音定位的经验来感觉出来的(但不准确),也是很多后期制作技术的应有,故意营造出来的,给人好像是这样的感觉。



我看到论坛上有很多关于定位的讨论贴,也对各位的热情非常钦佩。本帖的目的只是让各位对声像定位的研究有一个基本的理解。可能有人会问,几十年这么多科学家的研究就只有这几个重要的结论吗?是的。
声学是一门非常复杂的边缘学科。其中牵涉到生理、神经系统、心理、物理、数学等等学科,所以很多声学问题到现在也难以研究透彻。也正是如此,发烧界存在很多伪科学,很多似是而非的所谓结论,每每看到,也只能一笑罢了。
最后编辑auragon 最后编辑于 2009-06-17 13:10:23
分享 转发
TOP
2#

真正的行家。
希望多一些这样的帖子。
TOP
3#

声音、发烧不是科学能解释完全的。
除却西电不是线!http://shop34851791.taobao.com/
TOP
4#

请lz就史塔克演奏柯达伊(delos唱片,第5轨)这个实例解释一下为何大提琴在右下,小提琴在左上,请不要说是这两位演奏家的录音分别合成的
TOP
5#

很强的参考作用
逗你玩儿
TOP
6#

看来要重新审视一下,A3D、SRS这类东西了
TOP
7#

这个得时光倒流, 回到当年录音的地方, 然后走到录音师背后, 看他如何拨动调音台或混音设备的咯
知道ADD, AAD, DDD, 吧, 第二个字母就是混音啊? 没见过只有两个字母的, 就是说一定经过混音的
原帖由 艺术用家 于 2009-6-17 14:18:00 发表
请lz就史塔克演奏柯达伊(delos唱片,第5轨)这个实例解释一下为何大提琴在右下,小提琴在左上,请不要说是这两位演奏家的录音分别合成的
TOP
8#

猛贴。
美国JPS, 美国Sound Anchors, 美国ABYSS, 美国Cavalli
http://shop34547859.taobao.com/
TOP
9#

原帖由 艺术用家 于 2009-6-17 14:18:00 发表
请lz就史塔克演奏柯达伊(delos唱片,第5轨)这个实例解释一下为何大提琴在右下,小提琴在左上,请不要说是这两位演奏家的录音分别合成的


抱歉,我并没有这个软件。
我发的那个贴,只是目前关于声音定位研究的其中比较重要的结论,但还有很多研究得到的结论并没有说。比如,人耳对高频定位的感觉,大部分人都觉得要比低频的高,这也是一个有趣的现象。
我们实验室也对声音定位做过许多研究,而且,很多都是按频带区分的方式进行的,比如使用1个倍频程的窄带信号,例如250、500、1000Hz等,也得到许多有趣的结论,比如不同频带的定位位置不一样,全频带的定位要比窄频带的定位更模糊等。
另外,扬声器的结构也会对声音定位产生影响。特别是目前许多非同轴的多分频扬声器,本身不同频段的声音就是由不同位置的扬声器发出的,因此对声音定位在不同频段上有不同位置的感觉(但不能说同轴的就绝对重合)。

人耳对声音的定位机理真的很复杂,我个人认为也不是现在所取得的研究就能完全说明问题,在这里请各位不要钻牛角尖,知道大概的原理就行。
TOP
10#

原帖由 牧神午后 于 2009-6-17 15:09:00 发表
看来要重新审视一下,A3D、SRS这类东西了


有很多不同格式的环绕系统,其实都是利用“听觉错觉”的原理来进行的,目的就是利用人耳的可欺骗性,令人产生虚拟声像的错觉。
TOP
11#

不是钻牛角尖,不过是想透过文山字海直达问题的核心而已。大概的原理解释不了定位高低问题,看来是没有答案了。不过左右定位分频段不同这个理论倒是很有意思
TOP
12#

原帖由 艺术用家 于 2009-6-17 22:47:00 发表
不是钻牛角尖,不过是想透过文山字海直达问题的核心而已。大概的原理解释不了定位高低问题,看来是没有答案了。不过左右定位分频段不同这个理论倒是很有意思


嘻嘻,往往问题的核心本身就是一个很难解决的问题。
虽然通过对人耳声音的研究发现很多有趣的结论,但这些结论也只能是一个结论而已,以目前人类的认知能力,还不能有很清晰的解析。
TOP
13#

嗯!学习了。
最愛奚秀蘭並因奚秀蘭而發燒
我發表的以奚秀蘭爲主題的重要帖子的鏈結:http://post.baidu.com/f?kw=%DE%C9%D0%E3%C0%BC
TOP
14#

玩音响最怕的就是想当然而然。如果认为频率高所以听感才觉得高,那真的错得厉害。建议到调整到位的系统听听,小孩,**,男低音,女高音的定位,可以说多数的碟片,都可以听出不同乐器的高度。都可以颠覆频率高所以听感高的论调。
TOP
15#

支持楼主的说法,如果录音时可以定高低位地混音的,请做录音的朋友教教我!
淘宝网店:http://shop71227468.taobao.com/

发烧同好交流群号:211352456
TOP
16#

回复: 38度5线材及配件专栏(802页新到丝带高班信号线芬丽)

原帖由 远去的村庄 于 2009-6-18 1:19:00 发表
支持楼主的说法,如果录音时可以定高低位地混音的,请做录音的朋友教教我!


我的看法录音时就高低,又何必等混音时再搞,为什么可以肯定说有高低之分,因为早有LEO录测试高低的碟片。不相信的请用用皇帝位这张调整摆位碟试,里面有一首就是试高低位置的,里面的一段人声就是坐着,站着,还有站在椅子上发言的,录音士在168的集会也有介绍,实际在音响上也可以区分不同高度,听出真实高低位置。
TOP
17#

此帖不顶枉发烧!
TOP
18#

回复 16# 海阳 的帖子

皇帝位那种可以称为相对高度吗?是否掺有混响延时在内的?对发声源的高低判断,很多时是凭生活记忆吧?录音时就有了高度,那发声的高度是如何定位的?看影视时的发声点怎么又那么的准?到底是眼睛骗耳朵还是耳朵骗眼睛?君不见很多的现场录音,麦史风都是半天吊的多吗?几十轨出来的,又是如何混到立体声去?信息量中还能有高低度的信息在内吗?

我想都是存在很多争议的地方!象楼主说的,复杂!!
淘宝网店:http://shop71227468.taobao.com/

发烧同好交流群号:211352456
TOP
19#

原帖由 远去的村庄 于 2009-6-18 2:19:00 发表
皇帝位那种可以称为相对高度吗?是否掺有混响延时在内的?对发声源的高低判断,很多时是凭生活记忆吧?录音时就有了高度,那发声的高度是如何定位的?看影视时的发声点怎么又那么的准?到底是眼睛骗耳朵还是耳朵骗眼睛?君不......


皇帝位这张碟是录音师自己说的,都是真实录音,是特别制作用来摆位调校的。问为什么,怎么录的,我不懂我不是专家,我不是录音师。是不是心理作用,看下奚秀兰到福建的贴,他就知道,在我家用条新线人声高度就矮了。我的系统声音我不敢说好,各人有各人的听音习惯不同,很难达到统一。只有在音场定位包括高低,听过就知道,相信就不会争论这个问题了。
TOP
20#

原帖由 海阳 于 2009-6-17 23:27:00 发表
玩音响最怕的就是想当然而然。如果认为频率高所以听感才觉得高,那真的错得厉害。建议到调整到位的系统听听,小孩,**,男低音,女高音的定位,可以说多数的碟片,都可以听出不同乐器的高度。都可以颠覆频率高所以听感高的论调。


高频率的定位要比低频率的定位普遍上觉得高些,这个结论不是想出来的,是经过大量的实验证明的。我们的实验对象包括经验很丰富的音响师、录音师,也包括很多不懂发烧是什么的学生(尤其是女生)。当然,我指的是大部分。然后,经过科学的统计得到的结果。
TOP
发新话题 回复该主题