空间音频处理技术解析

本文深入解析某中心的空间音频处理技术,结合心理声学原理与信号处理算法,通过串扰消除、扬声器波束成形和上混技术,实现沉浸式立体声体验。技术涵盖声场宽度控制、深度感知优化及听音区域扩展,适用于多种室内声学环境。

心理声学:宽度、深度与听音区域

在整个开发过程中,通过心理声学特性(包括宽度、深度和听音区域)来表征立体声场。研究声波在不同形状和尺寸房间内与听者的相互作用,以及信号处理方法对听者体验的影响。

宽度

宽度指立体声场中可定位元素在水平(方位角)平面上的角度范围(宽广与狭窄)。在确定声场宽度时,首先考虑可定位元素(如点声源),这些元素会导致听者双耳声学响应中的时间和电平差异。通过对比耳机与扬声器听音体验中左右耳响应的分离程度,可以建模这一现象。

与扬声器听音不同,耳机听音缺乏串扰路径。为使耳机听音更真实,可使用全通信号处理滤波器模拟点声源到一耳的串扰,另一耳则使用延迟低通滤波器。这两个滤波器通过头相关传递函数(HRTF)近似参数化听者的耳响应,确保信号频谱(或音调平衡)改动最小,保留原始播放内容。

对于外部扬声器,其串扰取决于摆放位置。例如,某设备左右扬声器单元间距较窄,而标准立体声对扬声器相对于听者呈60度角分布。通过串扰消除(CTC)方法,建模并反转每个单元与听者耳朵之间的方程组,解耦单元对的串扰。若单元超过两个,则采用更通用的零陷转向方法,设计所有单元的滤波器以在一耳消除声学响应。

滤波器设计可归一化以满足目标消除增益曲线,该曲线由同侧(身体同侧)与对侧(身体对侧)耳朵在不同频率下的声能功率比定义。这防止消除过程过度拟合特定位置,因为听者可能处于不同距离或未完全居中。

深度

深度指感知声场距离听者的远近(前置与后缩)。音频轨道中声音元素的定位距离与声源和听者耳朵间两信号的相干性相关。例如,来自扬声器的简单左右信号易于理解,但如果音频与房间混响混合,音频清晰度下降,声音听起来后缩。

在扬声器播放中,需处理扬声器指向性及其与房间环境的相互作用。直接声路径保留原始内容的清晰度,但当声信号经墙壁反射后,相干性损失会使感知声场后缩,导致元素空间模糊。这就是为什么在消声环境或耳机上听到的轨道比在混响房间外部扬声器上听到的更近(甚至出现在听者头部内部)且更清晰。

作为自定义空间音频技术的一部分,可通过波束成形控制扬声器指向性。扬声器单元经滤波产生声场,其指向性在轴上相干叠加,在轴外相消。即,当听者正对扬声器时声学响应最强,侧向±90度时最弱。

设计此类指向性的一种方法是在±90度角放置两个零陷,并控制轴上/轴外功率响应间的消除增益或零陷形状随方位角的变化。所得波束图的主瓣足够宽,在±45度方位角听音窗口内保持强直接路径,然后快速衰减以最小化轴外声能(可能经墙壁反射)。这使立体声更贴近听者,比未经声学处理的听音环境(如客厅)更具清晰度,效果类似于剧院在不同座位区域再现前置声场。

听音区域

听音“甜点”——高保真音频系统参考立体声对中的立体声像——在听者位置与立体声扬声器对形成等边三角形时最佳再现。若听者角度超过±30度,由于房间反射增强导致扬声器间至耳朵相干性损失,听者幻象中心会出现空洞。音频混音中的重要元素(如人声)失去存在感。若听者角度低于±30度,立体声像变窄,音频元素向中心塌陷。若听者位置离轴,立体声像会偏向一侧。

为应对此问题,空间音频技术旨在最大听音区域内再现立体声像。实践中,CTC滤波播放的预期听音区域与控制扬声器指向性的波束成形设计冲突。通过执行立体声上混并对每个通道应用不同波束成形滤波器,可实现折衷。例如,可上混为左、右和中心(LRC)通道,其中中心通道与中/侧分解中的左减右通道最小相关。

上混左通道经CTC滤波器处理,在虚拟化后消除右耳响应;上混右通道消除左耳响应;中心通道经宽主瓣波束成形。这意味着人声表演在中心更突出,而立体声平移乐器在侧边更清晰,为听者创造更沉浸的声音体验。

持续优化与参考资料

某机构持续迭代和改进技术,为客户提供最佳音频体验。若想深入了解波束成形和扬声器指向性在室内声学中的应用,可参考工程团队发表的论文:2020年EUSIPCO的“快速源-房间-接收器建模”和2021年EURASIP的“球谐波波束成形器设计”。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计