Parametric Spatial Audio (参数化空间音频) 介绍

avisup2 · 2024-12-7 08:02:02

Herbertzew · 2024-12-7 08:02:48

一般所谓的空间音频渲染器处理流程为拿到多个通道的声源信号，通过基于对象的方式利用相关算法对声源进行处理。每个通道拾取独立的声源信号，广泛应用于音频制作、现场扩声等领域。然而，对于日常应用，如线上会议软件，实现空间化渲染的算法无法满足需求。因为对于单只传声器而言，无法获取其接收到的信号的位置信息。因此，我们需要基于传声器阵列，根据多只传声器接收到信号之间的差异判别声源的波达方向，从而对不同方向的声源进行分离。

参数化空间音频的核心思想是对声场如何影响传声器阵列过程的建模。通过建模，我们分别考虑直达声和散射声对传声器阵列的影响，进而分离拾取到的信号中直达声和散射声部分。这种思想适用于很多空间声的处理场景。

在建模中，我们基于传声器阵列拾取的信号对声场进行分析，将声场参数化从而分离音频中的直达声和散射声。接下来，我们可以拿到我们想要的声音并进一步进行处理。这实际上是一个对声场建模的过程。单个点声源在发声时，不同阵列拾取到的信号包括直达声和散射声两个部分。针对使用不同的传声器阵列数量，建模的方式也有所区别。

在参数化空间音频中，完成对信号的建模后，我们要考虑如何分离直达声和散射声。这一过程是通过自适应滤波实现的。然而，参数估计是这一过程中的关键。针对不同摆放类型的传声器阵列、不同数量的声源，参数估计的思路都有所不同。信号分量的功率，同样满足信号分解的等式关系。通过分析信号分量之间功率的比值，我们得到两个有用的特征。对于SDR的计算，我们引入空间相干函数的概念。空间相干性用于描述声场中任意两点之间在频域产生的干涉现象。接着，我们基于传声器阵列指向性函数和扩散场假设，提取直达声和散射声的空间相干函数。

空间滤波实现直达声和散射声的分离提取，是参数化空间音频中最核心的目标。这一过程往往是通过自适应滤波器实现的。参数化空间音频中的滤波器主要可以分为两种类型：单通道滤波和多通道滤波。单通道滤波基于单个传声器信号的频谱进行增益，从而分离直达声和散射声。多通道滤波则使用多个通道的传声器信号对直达声和散射声进行分离提取，以更好地保证提取出来的直达声和散射声的纯净性，即去除不必要的声音内容，同时尽可能地保证声音不产生过分失真，更好地确保两者的均衡。

DirAC（Directional Audio Coding）是早期基于声场分析实现渲染的参数化方法。从2007年至今，DirAC被不断完善与推广。在后续的研究中，DirAC被进一步推广到了高阶Ambisonics重放。DirAC中的参数会在时域不断变换，为解决参数骤变导致的渲染结果产生伪影的问题，大部分重要参数都会基于递归平滑的方式解决。在DirAC中，参数初始化程序调用Matlab库中的getGainTable函数来初始化DirAC结构体中的VBAPtable元素变量，为矩阵形式，用于表示不同定位角度时所有扬声器的增益值。双耳渲染算法对多个声道到人耳传播路径进行了建模，对不同声道施加不同延迟来模拟ITD，对左右耳信号分别施加不同方向的心形线增益来模拟ILD。

		自动登录	找回密码
密码			立即注册

Parametric Spatial Audio (参数化空间音频) 介绍

大神点评（1）

说点什么

神回复