Michel Proulx
Miranda首席技术官
在目前,全球数字化视频的过程出现问题最主要实际上不是视频的问题,而是音频的问题。音频之中最主要的问题就是响度的问题。第一是频道和频道之间的响度问题,第二就是节目和节目之间的响度的问题。响度存在有个响度测量的问题,响度不完全是简单的音频电平高低的问题,不同的人对响度的感受是不同的,更多的是一种人的主观感觉。相对于音频电平的调整,更复杂的是响度控制的问题。响度测量不仅仅需要测量音频电平的高低,也包含了声音的不同频率响应。包括高频和低频部分,也包含了响度持续的时间,所以是比较复杂的问题。

图1介绍ITU-R BS.1770的标准,我们举例5.1的声道,通常会独立地去测量每个通道音频的响度。每一个通道之后相对有单独的滤波器,针对频率部分单独地去做响度滤波,给下一步的测量做准备。对5.1有些声道是比较的重要,所以有单独两个环绕声道有争议的调整,只是针对高频部分,低频基本上被忽略掉了,这是及时的响度的处理过程。
响度测量更多的是要基于一段时间内平均测量的值得到的相对比较准确的响度值。在杜比推荐做响度测量的方案中,它只对说话的声音做检测,基本对其他的声音不做任何的处理。对于EBU推荐的标准,这是欧洲的标准,它推荐的不仅仅是说话的声音的测量,而是对整个节目所有的素材里的声音都做测量。目前存在的两个响度的问题,其中之一是频道和频道之间存在声音响度的问题;更多的遇到的是节目和节目之间有响度的问题,在一个台每一个频道播出的节目和广告之间的响度的问题,接下来先介绍素材和素材之间响度的问题。

图2是一段比较长的片断,片断的音频响度值构成一个不同的曲线,在同一个节目之间有可能突然会出现声音的响度的波峰,也同时有可能有波谷的值,所以是呈现一条曲线波动的。因此整个音频存在所谓的动态范围,基本上从波峰到波谷动态变化的范围,被称为整个节目中音频响度的动态范围。相对于整个节目来说,针对最高最低有一个平均的响度值的水平。这个刻度值表明了目前音频的平均的响度值。

图3演示简单的节目和广告之间的片断,左边看到视频播放的节目和接下来的广告,右边是响度测量的实时的值。
这是响度值不做任何处理的时候,刚才是正常播的电视剧中间插播广告的时候,声音会突然地变高。
相对于它两个值这边是-27LKFS,节目是-21LKFS,它们之间的差别非常大。正常的节目没有任何的问题,问题是在插播中间的广告中出现了音频的问题,插入广告平均的响度值和正常节目的响度值是不同的,会出现突然的音频的跳变,这两个响度值根本不匹配,带来的问题是我们听到的声音忽高忽低。

在一个台里有不同的节目来源有演播室、服务器以及外来的信号等等,可能会存在不同的问题,以下将具体说明如何相应进行解决。
不同的节目会有不同的响度值,要解决这些问题要有相应的处理设备把响度值统一到我们的希望值的水平。通常来说是在后面切换台之后加上响度的控制器才纠正响度的问题,我们叫ALC这是自动响度处理。

图5是通过自动响度控制的处理,经过了处理之后我们可以明显地感到音频的变化是比较的温和,不会出现非常大的跳变,可以看到整个响度值是降下来了,因为声音会有不同的波动,自动响度控制改变了响度值但并没有改变音频的曲线,曲线是基本上跟原来是吻合的。
接下来介绍如何用相应的设备来处理音频响度的问题,对我们来说我们是将响度处理作为上下变换器或帧同步器上作为一个选件来实现响度控制。也是基于“ITU-R BS.1770”的标准先测量输入音频实际的响度值,把实际测量的值和希望的值做一个比较,两个值之间如果有不同的时候通过动态的音频响度处理来去实时地处理音频值的差别。响度的控制跟AGC自动增益的控制还不一样,增益只是控制电平,而响度控制要处理的事情要更复杂,处理的内容也更多。一些人认为好的音频是一种好的享受,我们希望能够在不增加设备的情况下给我们带来更好的专业级的音频的享受。

目前我们提供了三种响度处理的选件,第一是LINEAR ACOUSTIC的方案,第二是JUNGER的方案,第三是Miranda自己的方案,我们综合前两种的优点开发了自己的响度控制方案,不同的方案可以给用户提供更好的选择,用户倾向于用哪种音频解决方案可以自行选择如图6。

从图7中可以看出,目前大部分在做音频处理的时候需要额外的响度控制器,而我们把这些独立的音频响度控制设备集成到上下交叉变换处理器板上。对最终用户来说整个系统变得更加的简单,可以花更少的费用让系统变得更安全。
一个潜在的问题,在这张示意图中,外面来的信号有可能已经符合我最终希望的值(绿色显示),不需要做任何的调整直接音频进出都没有任何的问题。有可能会存在过来的信号我们不知道有没有问题,我也不知道过来的信号到底是好的还是对的,这里的好坏是相对音频响度值的不同的问题。如果过来的音频没有问题,之前做的节目已经把音频做好了,这时候还用ALC的控制会发生什么呢?有一些节目动态变化不是很大,比如说直播、新闻,本身音频没有什么问题。对这些节目即使做了处理也不会造成很大的影响,因为原始的音频动态变化不大,即使加上处理也不会有太大的影响。有些节目,比如电影、戏剧本身音频的动态范围非常大,响度变化非常大,如果进行处理就会把整个动态范围缩减。问题是不同的节目和广告之间怎么去控制音频的跳变的问题。在播出当前进来的音频需要不需要做处理,如果不知道过来的音频到底是怎样的我们要做这样的处理。因此对已知过来的节目音频已经符合预期,我们可以通过自动控制决定响度控制是直接旁通还是处理,这个可以根据我们的需要由播控软件,或者是手动GPI的面板去进行控制。对于一个不需要做音频处理的节目,我们的节目不做任何的改变,整个的原始动态范围仍然是保持原始状态,当不知道或者是没有旁通的素材自动响度控制处理的时候是非常快速的过程,可以很快速地就可以把音频问题进行处理。

如何解决频道和频道之间的响度的控制问题。比如两个不同的电视台每个电视台都有多频道的播出,一种是每个电视台都约定俗成,约定共同的标准比如说-24 LKFS,大家都会匹配这个值,在美国目前定的是-24 LKFS,欧洲定的是-23 LKFS。另外一种,AC-3音频可以把响度值写到元数据中,对于不同的电视台可以有自己的值,但需要将响度值正确的写到刻度值当中。比如不同的电视台有不同的标准,第一是-24 LKFS另一个是-28 LKFS都可以,因为最终接收进行音频解码的时候可以根据元数据里面标示的值正确地去解(见图8)。[Page]

图9为美国NBC电视台响度控制的实例。B&P