沉浸式音频到家庭观众的复杂性

2023-04-11 丹尼斯·巴克斯特依马狮视听工场

沉浸式音频到家庭观众的复杂性

转播车内22.2音频室

电视广播沉浸式声音总的来说就是空间定位、声音分离，并希望听众可以通过扬声器或耳机还原某种维度的声音。显然，混录调音台无法控制声音生态系统或消费者如何听内容，但沉浸式的声音还原似乎是一个活动目标，而且创作一个可以很好地通过扬声器、条形音箱和耳机听到的引人入胜的混音，并非轻而易举。

水平层

问题往往始于过于保守的声音设计，但作为声音从业者，我们必须从某个地方开始并向前发展。通常，声音设计将音频视为水平层，例如，沉浸式声音提出一个人耳水平的声音水平层和一个听者头顶上的声音层云。NHK甚至建议，应该有在耳朵水平下方呈现的声音。

在最初设想并测试沉浸式声音时，推断上述的声音应被捕捉并置于上层声音区域，并由高度扬声器还原。即使是基本的声音设计原则也表明，混音应该是犹如身临其境的声音。水平层声音对于基本的沉浸式声音制作和学术考虑是好的，但如果观众头顶上的“真正”声音是扩散的氛围和过度的PA噪声，那么这些声音对有意思的沉浸式声场/混音没有什么特别的助益。

此外，我认为听众前面太多的氛围声会令人厌烦、疲劳，并影响言语可懂度，这也是为什么沉浸式声音录音师应该考虑另外混录设计的原因之一。例如，大多数条形音箱在听众前面呈现声音，我认为这应该是音效设计师/录音师一个主要考虑因素。

因为大多数沉浸式的条形音箱都是向前、向上和侧面朝前呈现声音，那么问题来了——是向上投射的条形音箱在听众面前呈现更多的氛围声，而稀释了混音吗？如果前左和前右高度声道被主要用于氛围，这可能属实。

例如篮球

考虑如果前面高度声道是从前面和向上呈现声音，那么使用前面高度声道强化屏幕动作、对白和辅助音频是有意义的。前声场增强（FSR）是我在2016年德国通迈斯特会议上发表演讲以来一直推广的一个概念。

FSR基本上支持使用完整的前垂直声场——左右声道以及左右高度声道来混合围绕视觉呈现的前“声音框架”。例如，篮球有一个清晰的有篮网和篮筐的顶层框架以及有地板的底部框架。通过在垂直视角中置入一些声音，这种设计有助于将2D声像提升到3D声音空间。

2014年，日本NHK开始测试基本的沉浸式声音制作，2016年晚些时候，NBC开始在奥运会和美式足球比赛中测试各种话筒方案。2016年，首尔广播系统公司采用ATSC 3.0和MPEG-H编码器，将2018年世界杯转播到韩国的家庭。

音频

沉浸式音频到家庭观众的复杂性

ORTF 3D话筒阵列

2018年世界杯可能是首个通过增加用Schoeps话筒构建的头顶氛围层实现沉浸式声音混合的大型体育赛事。菲利克斯·克鲁克斯是音效设计师，并与赫尔穆特•维特克合作研制沉浸式声音阵列ORTF 3D上合作，ORTF 3D被描述为“使用8个话筒碳精盒的双层ORTF”。

例如，据NBC体育台的音效设计总监卡尔·马龙，NBC已经在圣母院美式足球队比赛中制作了几个赛季的沉浸式声音，并使用各种单声和立体声话筒产生沉浸式声音。简单的沉浸式声音制作并不需要3D话筒或3D混录母线，但实际上广播公司使用的所有混录调音台（如Lawo、Calrec和SSL）都有3D环绕声像控制器，可以轻松地定位/放置听众周围的声音元素。

3D声音所需要的是更敢于创新的音效设计以及对编码以及解码/渲染如何影响音效设计的良好理解。在我的篮球例子中，我建议使用一对颈挂式话筒捕捉篮板和投篮声音，并将这些声音作为音频元素/对象渲染进左、右高度声道中。

有经验的声音从业者可能会问：“在立体声或环绕立体声混音中，上述声音会发生什么情况？”格式之间的互操作性一直是个问题，但数字声音、元数据和渲染解决了一些格式之间的转换问题。Dolby Atmos、Auro 3D、DTS:X和MPEG-H是沉浸式声音分发编码的例子；当还音设备检测到某一编码解码，它将给予适应还音设备和换能器数量的适当平衡和空间化。例如，对支持Dolby Atmos的上射式条形音箱，它应该投射听众上方的篮网声音。

各种各样的播放设备并不能保证有相似的声音体验，但我认为几乎任何播放设备都优于后置的电视扬声器。

希望不仅仅是一个概念，它需要我们用行动去争取，着手努力去实践。成功的沉浸式声音在于混音。

沉浸式音频