微博

QQ

下一代音频系统:沉浸式全景声和个性化音频

2016-05-04 Larry Schindel 美国线性声学公司(Linear Acoustic) 传播与制作


  下一代音频系统正在逐步兴起,这将提供给电视观众和广播机构诸多好处。这些新系统将允许观众个性化并完全掌控他们的聆听体验,还可以享受一种更具吸引力和身临其境的声场效果。广播机构将得益于能够利用一种简单的创建和使用方式,提供给他们的观众一个全新的、更为完整且令人满意的用户体验,而且通常是采用与现有系统相同甚至更少的传输码率。

  这些系统包括一些新的功能,如沉浸式全景声和个性化音频,这两者都很关键。

  沉浸式全景声,也被称为3D音频,即将在电视系统上线播出。其实它已经在电影市场使用了好几年,例如杜比全景声(Dolby®ATMOS)技术,已经发展成熟。而一种稍微简化的全景声技术,也已经出现在消费市场中的蓝光和一些在线流媒体格式之中。简化是必要的,这能够增强新的格式对消费者的吸引力,(即使我专门从事电视音频研究工作,仍然难以从我妻子那里得到在我的家庭影院里安装128只音箱的许可!),同时保持对传输带宽、存储和处理的合理需求。消费者要体验沉浸式全景声,最常见的配置是7.1.4(也称为7.1+ 4或11.1)。在人耳高度水平面的7.1声道之外增加4只头顶音箱。在小房间里,比如典型的家庭影院环境,7.1.4可以提供一种极具包围感并令人愉悦的听音体验。真的没有必要增加更多的声道。

  聆听电视节目的沉浸式全景声真的让人感觉身临其境,就好像您是电视节目的参与者,而不是仅仅在一旁观看。由头顶上的声音通道所产生的附加的环境声能够创建一种引人入胜的全新体验。毫无疑问,含有战斗,爆炸,子弹从头部划过,车祸和其他动态声音呼啸而过的动作场面自然是能够真正创造“哇哦!”的因素,但在这身临其境的全景声中真正令人印象深刻,能够将观众带入节目的,常常是一些细微的声音 - 雨声,滚雷,头顶上风吹树叶的沙沙声,交响乐大厅的混响或者观众的掌声。

  尽管沉浸式全景声所创造的更加逼真的声场效果令人兴奋,但下一代音频系统真正有新意的创新点在个性化应用。作为消费者,想象一下您可以在一场足球比赛期间自主选择听哪一位播音员的解说;主队解说,客队解说,或者他们各自的电台解说,甚至不听解说专心观战。您还能够选择收听基于多种不同环境声的混音。也许是听上去像球迷坐在看台上的角度,或者您想在前置声道更加突出球场(场地内)的声音,而从环绕和头顶声道来表现人群环境声,以获得更佳的参与体验。如果您愿意的话,您甚至可以加入裁判麦克风的声音,或者场地的现场扩声播音员,并控制这些声音的音量大小。

  当电视机构使用下一代音频技术提供多语言播出时,替换语言可以作为独立的单声道信号送出,消费者的终端设备将所选语言混入主音频。这样第二,第三,甚至第四语言都不需要进行单声道或立体声预混。此方法的好处在于:广播机构可以利用较低的码率来传输这些对象而无需进行预混,同时为观众提供更多选择;而观众可以收听各种语言的环绕声音频,并对对话的音量大小进行必要调整。新的工作流将让所有喜爱不同语言的观众都能够享受多声道音频节目,获得更好的聆听体验。

  在技术层面上,内容制作和发行端以及广播链路的消费终端都需要新的产品和工具以支持这些创新。现有工作流和音频制作、打包以及传输方式都需要做出改变,以支持提供这些更先进的音频信号给观众。作为当前完整混音(CM)传输方式的替代,独立混音对象或将可以被传输至观众接收端。下一代机顶盒和电视将能够接收多个节目对象,并将它们以观众期望的方式混到一起以创建最终混音。图1简要说明了这一概念:

下一代音频系统:沉浸式全景声和个性化音频

  这些下一代音频系统的设计与目前基于SDI系统的兼容性非常好,并完全具备向越来越普遍的基于IP工作流进行扩展的能力。

  即使面对现有SDI工作流的一些局限性,下一代音频也能够提供基于目前系统框架下的许多好处。例如,当进行多语言广播的时候,SDI的可用声道可能很快就会被填满。主要语言5.1环绕声,第二语言5.1环绕声,以及两种语言对应的立体声或双声道即可完全填满SDI的8对(16个)音频通道。下一代音频系统可以简化这种情况,并允许广播机构为所有观众提供更多语言、服务,甚至是7.1声道(或更高)。图2举例说明SDI流音频通道可以如何构建:

SDI 音频通道 当前SDI音频流 下一代音频
1/2 第一语言
5.1环绕声
 
7.1环绕声
(M&E)
3/4    
5/6    
7/8 第二语言
5.1环绕声
 
 
9/10   第一语言 第二语言
11/12   第三语言 第四语言
13/14 第一语言立体声 主队解说 客队解说
15/16 第二语言立体声 广播解说 裁判麦克风

在这个例子中,通过使用下一代音频系统,广播机构可以提供可选语言和偏好场景的7.1声道沉浸式体验。这和我们今天使用相同的音频通道数所能提供的服务比较是一个显著提升。

 

这仅仅是一个例子。下一代音频系统具有足够的灵活性,可以为不同类型的节目,如体育、戏剧、电影、歌唱竞赛表演等提供更多的选项,组合或节目内容等。

 

这里还有一个无法忽略的内容必须要提及,那就是“大M”——元数据(Metadata)。众所周知,元数据普遍存在于杜比音频码流中,并且是任何杜比音频码流的固有部分(也包括其他一些音频格式)。虽然我们不可能获得没有任何音频元数据的音频码流,但元数据在很多情况下非常有可能、且很容易被错误设置。在过去的10 - 15年里,许多广播机构发现,对音频进行处理来匹配元数据,较之设置正确元数据参数以匹配音频更具可操作性,且易于实现。

 

展望未来,元数据将依旧是音频流的一个重要组成部分,而且必须正确设置才能为观众提供他们想要的体验。也一定会有新的元数据参数出现,但在许多方面都将比以前的元数据要更加简单易用。例如,借助元数据来识别不同的混音对象(M&E基础混音,英语、普通话、地方方言,或主客队现场解说,场地效果,主裁判麦克风等)是必需的。

 

这一切谈论关于将音频作为独立对象传输,增加新的元数据,并允许观众选择他们希望得到的沉浸式全景声体验,很容易让人不知所措,认为没有办法可以预知观众将得到何种体验。在您开始恐慌,或您认为将要对最终的音频输出失去控制之前,需要特别说明的是:增加的元数据将会为观众提供更好的体验,同时节省宝贵的传输带宽。

 

制作人和广播机构能够为观众提供一些简单易懂、预先设定的选择,并以此为依据来创作元数据,以优化其聆听体验。观众会发现很容易就能选择自己喜欢的语言,让听力受损的观众轻松提高对话的音量,或者选择他们想要收听哪个队的解说。利用元数据,观看体育比赛的电视观众甚至可以将解说放在后置声道,保持赛事声音在前置声道。元数据是下一代音频系统的基本组成部分,绝不能被忽视。好消息是下一代音频技术供应商已经想好如何使新的元数据比现有系统中的元数据更容易理解、配置和使用。

 

下一代音频系统尚处于其发展的初级阶段,未来几年内广播行业向这些新系统的过渡肯定会是一个激动人心的时刻。

 

作者:Larry Schindel先生

 

作者简介:

Larry Schindel是美国线性声学公司(LinearAcoustic Inc.)的高级应用工程师,美国线性声学公司致力于研发和制造广泛用于电视台、有线和卫星电视运营商、后期制作和其他内容服务供应商,对数字音频进行控制、测量、管理和监听等专业设备。

在美国线性声学公司,Schindel先生主要负责对数字电视广播机构的技术支持与培训,参与定义和指导多通道响度控制,5.1声道环绕声上混和音频测量等技术发展。

在加入美国线性声学公司之前,Schindel先生在杜比实验室工作,他的职责包括管理能够让专业广播设备厂商将杜比技术集成到他们产品中所使用的电子模块产品线。他还协助开发杜比新技术的授权许可计划,并对这些授权许可用于消费者的广播和家庭影院设备之中进行管理。

此前,Schindel先生在音响设备制造商ART(Applied Research and Technology)和ASHLY Audio担任工程职位。他曾广泛参与现场扩声,录音和广播音频项目,并仍然活跃在这些领域。而在纽约CBS电视台工作期间,他和他的团队被授予艾美奖(Emmy Award),以表彰他们在1998年日本长野冬季奥运会转播工作中的突出贡献。

Schindel先生是AES,SMPTE和SBE的成员。

全景 音频 沉浸式

视听科技视频号 广告
发表评论