响度：测量标准的演进

2012-06-14 吴潇思传播与制作

　　从今年12月13日开始，美国的电视运营商们需要为过响的商业广告付出代价了。CALM Act（商业广告响度缓和法案）将从这一天开始，正式在FCC的监督下施行。今后，美国观众可以不仅仅是在调整遥控器音量按钮时抱怨几句，他们的投诉将有可能让电视台面临罚款，甚至是吊销执照的风险。将电视伴音响度写入凌驾于广电行业规范之上的法律文本中，可见响度问题之严重。

　　自2006年ITU颁布了ITU-R BS.1770响度测量标准以及ITU-R BS.1771响度表标准以来，美国，欧洲，日本以及中国大陆的制播机构都迅速跟进，探讨基于新的电视伴音响度和电平计量标准之下的制作以及传输规范。已经成型的制播规范包括美国的ATSC A/85（确立和保持数字电视音频响度的技术），欧洲的EBU R-128（音频信号响度归一化及最大允许电平）标准及丰富其可操作性的4个制播建议文本3341（响度表），3342（响度范围），3343（制作）和3344（传输）。在我国，响度问题也得到了空前的重视。虽然尚未有标准出台，然各台以及网络公司已在着手探索解决方案，一方面是源于观众投诉，另一方面也是为将来标准出台做好准备。

　　笔者在工作过程中发现，虽然业内十分关注如何使用“基于ITU-R BS.1770算法的响度处理器”来解决伴音响度浮动过大的问题，但对BS.1770标准本身却依然有诸多疑惑。而并不广为人知的是，这个标准，到今天为止，已历经了三个版本的演进，而最新的BS.1770-2依然不能说是最终版。

　　背景

　　要了解标准，先让我们简单了解一下标准出台的背景。长期以来，人们对声音响度这一主观感知量的测量一直是以纯音为基础的基本定义，分别通过对不同声压级和不同频率的对比测量而得到。传统的响度单位(非国际单位)“Sone”和“Phon”就是根据人对稳态1kHz纯音声压级的主观感知来定义的。而大家熟知的等响曲线（见图1）也是对稳态的纯音利用对比试听的心理声学的研究方式获得的。等响曲线表明了主观感知的响度与声压级以及频率之间的关系。但现实生活中的声音大多数时候是由复合音构成的，是瞬态的。同时，影响声音的响度感知的其它因素，如持续时间则无法从这张图上直接读到。

响度：测量标准的演进

图1

　　虽然基于声压级和频率的测量，能够反映出客观量和主观之间的关系，但对音频节目的制作帮助有限。由于音频节目是以电信号的方式存在和传输的，制作人员只能通过对电信号的测量来预测节目的响度。与声信号的声压级，频率和持续时间相对应的电信号参数分别是：电平，频率和积分时间（启动时间）。

　　VU（Volume Unit）表，由于其指针的上升时间（当馈入一个0dB信号时，VU表读数从负无穷到0dB所需的时间）为300ms，大于人耳感知响度所需的积分时间（100-200ms），于是，VU表能够比较好的帮助制作人员判断节目响度变化，至今仍然有非常广泛的应用。但VU表本身的设计中并没有采用任何与主观响度感知相关的频率加权技术。

　　PPM（Peak Program Meter）峰值表是另一种电平测量工具，与VU不同，它的启动时间很短（10ms），也称为近峰值表（QPPM）。进入数字音频时代后，由于量化精度的限制（0dBFS），需要更精确地指示数字样值信号峰值，进而出现了采样峰值表（SPPM）。峰值表帮助制作人员更好地判断信号的最大值，保护信号不被削波。但由于积分时间太短，不足以达到人感知响度所需时长，依靠峰值表基本无法判断节目的响度。使用峰值电平作为节目信号的标准化依据，也在一定程度上导致了今天我们所热议的“响度竞争（Loudness War）”。

　　为了能在数字音频时代更准确地指示节目的响度和峰值，在全球范围内形成统一的节目交换标准，一个基于数字音频信号的响度和峰值测量的国际标准，势在必行，

　　ITU-R BS.1770

　　ITU在2006年颁布了ITU-R BS.1770标准，全名是“音频节目响度和真实峰值的测量算法”。请各位读者注意，标准出台伊始，便明确指出了该标准为测量算法，非处理算法（关于这方面的误区，由于字数所限，将另文阐释）。这一版本也为后续确立了响度测量的框架（见图2）。标准的另一部分，是关于真实峰值的测量，本文暂不做介绍。

响度：测量标准的演进

图2

　　这个算法以非常简洁的方式，兼容了从单声道到5.0在内不同格式伴音的响度测量，由两级滤波器（模拟人头效应的pre-filter以及响度主观感受的计权的RLB filter），积分以及声道加权（环绕声道的权重比前方声道多1.5dB）组成整个计权网络。

　　测量算法的核心，便是RLB滤波器，也称RLB计权曲线（见图3）。这是将客观可测量的电平值与人主观感知的响度之间实施对应的关键一环。

响度：测量标准的演进

图3

　　据ITU委托加拿大通讯研究中心（CRC）的实验结果，在单声道测试条件下，Leq(RLB)，即基于RLB曲线计权的平均化计算的结果与人的主观响度判断（基于实际的节目，而非纯音）达到了98.2%的吻合率。有趣的是，CRC同时发现，如果仅是测试单声道节目伴音，单纯的能量平均化（Leq）也能达到和带计权的Leq（RLB）几乎相同的准确率。在对一组由单声道，立体声和环绕声的混合素材的测试过程中，CRC发现Leq（RLB）响度测量结果与主观判断的吻合度达到98%。

　　ITU-R BS.1770-1

　　2007年，ITU发布了BS.1770的第一个修改版BS.1770-1。虽然这一修改版并未对算法进行改动，但定义了经由BS.1770算法测量得出的满刻度响度单位LKFS，取代了上一版中的dB。明确了响度和电平在单位上的差异。标准还给出了在1kHz时，数字电平与响度的对应关系：即向左，中，右中任意一个声道输入0dBFS的千周信号时，输出的响度值为-3.10LKFS。这个单位沿用了与dBFS相同的计量方式，响度上1LKFS的变化和信号电平1dB的变化是等效的。[page]

　　ITU-R BS.1770-2

　　2010年春天，ITU将EBU提出的”Gating”方案加入响度算法。那什么是“Gating”呢？

　　简而言之，在BS.1770-2中，Gating就是要将节目中不需要纳入响度计算的部分排除出去。那为什么需要排除这些部分呢？我们知道，电视节目的伴音并不是仅仅由单一的声音要素构成，比如纪录片，伴音里就有解说，环境声和背景音乐，甚至是无声的片段。我们的大脑在判断声音的响度时，并不是将这些不同的声音元素或内容“一锅端”，而是先要取舍。由于了两级“Gating”，计权网络也相应作出了调整：

　　Gating分为两级，分别使用绝对门限和相对门限。

　　第一级：绝对门限(Absolute Threshold)

　　在先前的算法中，BS.1770的积分模式是从节目的开始到结尾的时间全长范围内所有采集和计算的样点实行积分和平均化运算。这其中，不可避免地也纳入了静音或响度极弱的部分。举例来说，在播音员播音的过程中，字与字，句与句之间有中断。虽然，中断并不影响我们播音员语声响度的主观判断，但如果这个中断部分被纳入BS.1770的响度（积分平均化）计算，将使最终得出的响度值低于语声的响度值，实际上降低了响度测量的准确性。所以，这一版标准中规定，节目中所有低于-70LKFS的部分将不纳入最终的响度计算。

响度：测量标准的演进

图4

　　从图上我们能够看到，Gating发生在整个响度处理的最末级，也就是积分之后。那么Gating所排除或舍弃的部分自然也是经过积分的，那么应该如何来实现呢？EBU的工程师提出了“块”的概念。以400ms为一个单位积分时间，也就是整个节目将被切成若干个以400ms为长度的“块”，为了让测量的准确性更高，相邻的“块”间有75%的时间重叠。在绝对门限的Gating计算中，所有响度低于-70LKFS的块将被舍弃。

　　第二级：相对门限（Relative Threshold）

　　科研人员很早就发现，人对响度的判断，与其注意力有关。心理声学中的“鸡尾酒会效应”也是一种例证。杜比公司在其研究中发现，由于电视节目伴音的主要内容为语言，或称对白，观众对节目整体响度的判断也主要基于对白的响度，这也是前文中提到的对声音元素“取舍”。杜比公司提出了对白智能（Dialog Intelligence）的技术，分离节目中的对白成分，并对其单独实施响度测量，以此作为对节目响度实行归一化的依据。这一做法得到了ATSC的支持，ATSC在其A/85文档中将节目伴音中可作为响度归一化依据的元素称之为锚元素（Anchor Element），并多次提到，对白是最重要的一种锚元素。

　　而EBU的专家在R128中则提出了另一种分离“锚元素”的方式，即利用前景声（吸引观众注意力的部分）和背景声（对观众响度判断没有影响的部分）之间的响度差对二者实行分离。其计算方法是，第一阶段，经过第一级绝对门限的排除之后，对剩余的块实施平均计算，得出一个平均响度值。第二阶段，对经过第一阶段排除后剩余的块进行筛选，再舍弃响度低于该平均响度值-8dB的块。然后再对最终剩余的块的响度实行平均计算，得到输出的响度值。

　　在ITU对BS.1770-2的讨论中，采纳了EBU提出的以相对门限的方式分离“锚元素”的算法，但将相对门限由-8dB修改为-10dB。

　　结语

　　BS.1770-2算法甫一推出，争议不断。虽然离颁布时间已过去一年，美国尚未采纳BS.1770-2，A/85中依然沿用BS.1770-1。而日本ARIB在去年颁布的TR-B32标准中，采纳了BS.1770-2。

　　由于篇幅所限，无法对本文中所提及的概念进行深入探讨。纵观整个响度测量标准，目前对环绕声响度的主观验证性测试结果尚未十分成熟，LFE对响度的影响也在讨论中，真峰值测量的算法尚存争议，这些都决定了ITU-R BS.1770还将继续前行，让我们拭目以待。B&P

ITU 响度测量标准 ITU-R BS.1770