在影院看电影的时候,我们能感受到声音从我们的左边、右边、后边甚至是头顶传进我们的耳朵,从而给我们带来更好的听觉体验。这种能够使声音具有空间方向感的技术被称为环绕声技术,它能让听众体验到与现场几乎一致的声场。
那么,如何才能实现这种环绕声技术呢?显然,最简单的思路是,在我们的耳朵四周放尽可能多的扬声器,这样不同的扬声器重放的声音能够让人耳感应到声音来自不同的位置,这也是电影院空间音频的设计思路。
但是,对于个人来说,这样会增大我们的设备成本。与具有复杂音响设备的电影院不一样,我们的耳机只用左右两个扬声器也可以实现这种效果。这种用两个入耳式耳机发出空间中任意方向声音的技术被称为虚拟环绕声技术,也被称为沉浸式空间音频技术,是我们接下来要关注的重点。
空间音频的目的是为了让人耳对重放的声音有更真实的空间感。因此,要深入了解空间音频技术,首先需要我们思考一个问题——人类是如何判断声音方向的呢?
Part. 1
人类双耳如何判断声音方向
大家都知道,我们可以凭借一只耳朵来感受声音的响度、音调和音色。但是,如果想辨别出声音的方向,就要依靠两只耳朵了。原因在于两只耳朵才可以听出时间差和声级差。时间差是指声音抵达两只耳朵时间的前后差别,声级差则是两只耳朵听到声音能量的大小差别。
比如在下图场景中,声源在我们的右边时,我们的右耳会先听到声音,之后声音才会到达左耳。声波在空气中的传播距离越长,能量会越来越小,因此右耳听到的声音能量要大于左耳。
那么仅仅依靠时间差和声级差这两个因素,就可以实现声源在三维空间中的定位吗?
别着急,先看看下面这个场景。
如下图场景,当声音从我们的正前方和正后方发出的时候,到达双耳的时间差和能量差都是零。也就是说,当声音到达两耳的时间差和能量差都是零时,我们无法区分声音是从正前方来的,还是正后方来的。
那么,问题又来了,双耳怎么辨别声音的前后方向?事实上,声音从发出到被我们的耳朵听到,经历了三个过程——传播过程、生理过程和心理过程 [1]。由于生理过程和心理过程几乎不可操控,在这里我们仅仅关注传播过程。
传播过程也称为物理过程,是指声源发出的声波经由介质到达耳廓,再通过耳道传递到鼓膜并引起其振动的过程。这是一个极其复杂的过程,人耳廓构造的不同会使声波经由耳廓影响后形成的波形不尽相同。
显然,正前方声源的传播过程和正后方声源的传播过程是不一样的!因为我们的耳朵并不是前后对称的。来自正前方的声音经过耳廓反射,可以直接进入耳道;而正后方的声音则需要绕过耳廓才能进入耳道。也正是由于这种不同,我们才可以分辨出声音来源的前后。
耳廓相当于一个给声音进行“加密”的设备,而我们的大脑经过长时间的学习,已经完全掌握了这门“解密技术”,因此,可以轻而易举地听出声源的前后方位。
现在,我们终于有了答案,双耳定位三维空间中声源的方向依赖于耳廓的“加密” [2,3]。
Part. 2
耳机的虚拟环绕声
更加科学地讲,加密声音的不仅仅是耳廓,还有头部轮廓和肩膀等身体部位。由于这一系列的影响都与头部有关,因此这种加密方法也被研究人员称为:头相关函数(Head Related Transfer Function)[4,5]。
头相关函数可以理解成我们头部对于声音的加密方法,这种加密是针对不同方位的。也正因为头部对于各个方向上的声音加密方式不一样,我们的大脑才可以解密出声音的方向。
为了解密不同声源方位的加密方式,研究人员可以通过测量或者计算得到不同方向的头相关函数[4,6],然后组成一个数据库。
我们戴上耳机之后,声音便直接经由耳道,被鼓膜接收了。失去了头部加密的过程,耳机内的声音听起来也就没有了方向感。
但是,随着声信号处理技术的发展,我们可以通过在耳机内部置入电子设备,来模拟头部的加密过程。如果我们的电子设备与头相关函数的加密方法一致,那么经过电子设备加密之后的声音就可以被大脑解密出方位信息,成功地“欺骗”大脑。
正是基于这样的思路,工程师们开发了基于头相关函数数据库的空间音频方法。他们用数字电路来模拟整个的头相关函数数据库,然后对耳机内的声音进行特定方向上的加密,这样,就能够让耳机内的声音听起来具有特定的方向感。
举例来说,在一场真实的音乐会上,小提琴在听众的左边45°,钢琴在听众的右边45°,无论是小提琴的声音,还是钢琴的声音,都能够经过听众的头部进行加密,现场声音听起来就有很好的方向感。
如果线上的观众也想通过耳机获得身临其境的体验,那么耳机内部的数字电路可以选择左边45°的头相关函数来加密小提琴的声音,右边45°的头相关函数加密钢琴的声音,这样就能够“欺骗”大脑,让耳机内的声音听起来也有很好的方向感。
由于这种声音不是从真实的空间中发出来,而是通过信号处理这样一种虚拟的方式“加密”出来的,所以被称为虚拟环绕声。
近些年,随着耳机等可穿戴设备的应用越来越多,虚拟环绕声技术得到了大量的应用,也被科技公司称为沉浸式空间音频技术。