更深入地探讨音频元数据(1)
2002-12-27
Tim Carroll 依马狮商务网
合理设置元数据,可使5.1声道节目能够被单声、立体声和5.1声道解码器正确地再现出来,而且它还控制节目的动态范围,从而使之适应于收听环境。有鉴于此,必须正确地设置元数据,使之按照其预定的方式工作。 |
重要的事情先说,值得指出的是,音频元数据有两种类型或等级:消费级和专业级。消费级元数据出现在每一个Dolby Digital(AC-3)码流中,它被Dolby Digital解码器用于优化被解码的音频。另一方面,专业级元数据则是消费级元数据的一个超集,事实上它永远不会被传输到消费者那里。专业级元数据要携带多达八个消费级元数据码流(或节目)及其它控制参数。 |
专业级元数据被用于向多台Dolby Digital编码器馈送信号,这些编码器析取合适的消费级元数据节目并将其传送到……你可以猜到是,消费者。 |
尽管总共有约27个消费级元数据参数,但我们仅仅探讨其中我认为最重要的几个。 |
|
对白电平(也称对白范数) |
对白电平(也称之为对白规范化或对白范数)设置值表示节目中对白的平均响度。该参数控制Dolby Digital解码器中的一个衰减器,此衰减器将解码器的平均音频输出规格化为一个预置的电平。这就确保消费者观看电视节目时,在插播商业广告或转换频道时不用调整音量。 |
合理的对白电平设置值是通过测量其长期A加权响度等效值,即Leq(A),来确定的;目前已经有一些产品能够进行这种测量,其测量方式比顾名思义所想象的简单得多。对白电平设置中使用的取值范围为-31~-1dB,步幅为1dB,其中-31表示没有衰减,-1表示有30dB的衰减作用于消费者的解码器上。这是什么意思呢?我知道,这听上去与直观的感觉正相反,但令人惊讶的是,它居然很有意义。Dolby Digital解码器将平均响度标准化到-31dBFS Leq(A),(0dB满标度数字以下31dB,时间平均值)。当解码器收到一个相对宁静的输入信号(如对白电平设置为-31的故事片)时,它假定该节目已经匹配于-31dB Leq(A)这一目标电平,所以不需要进一步的衰减。 |
| 图1 多个节目(声道)以不同的对白电平 设置到达Dolby Digital解码器 | 另一方面,诸如实况音乐会之类的响度较大的节目,则可能需要衰减,以便使其Leq(A)达到-31dB。例如,当对白电平参数设置为-21时,解码器将对信号施加10dB的衰减;当该参数设置为-11时,施加20dB的衰减,依此类推。 需要施加的衰减值的一种简单计算方法就是在对白电平设置上加31。例如,31 + (-31) = 0dB衰减,而31 + (-20) = 11dB衰减。由于每步1dB的分辨率相当粗糙,所以不言而喻,对白电平设置仅在节目变换时才发生改变,而且对增益曲线节目音频来说,确实不是一个很好的办法。 合理地设置对白电平参数不仅确保节目到节目和频道到频道的响度变化得以控制,而且构成Dolby Digital系统中所包含的动态范围控制(DRC)系统的基础。如果对白电平参数设置得不正确,则可能导致DRC对其正在处理的音频做出不正确的反应。 |
|
动态范围控制(DRC) |
不同的聆听环境提出了各种各样的动态范围要求。显而易见,一部宁静的影片与嘈杂的环境是不合拍的,而一部喧吵的影片也与宁静的环境不合拍。传统的解决方法一直是在传输音频信号之前,大幅度地减小其动态范围,这样音频电平就可以由每个观众自己设置以适合他所处的环境。其不良的副作用就是音频效果丧失殆尽。爆炸声、对话声和背景花草鱼虫的声音全都以相同的响度被再现出来,节目的声音听上去显得,最起码可以说,很单调。 |
幸好还有一种解决办法。Dolby Digital提供了一种相当独特的DRC系统。基于预先选择的DRC系统设置文件,Dolby Digital编码器计算并与原始音频信号一起发送DRC元数据。DRC元数据随后可以由解码器施加到信号上,以减小该信号的动态范围。在许多解码器中,DRC可以随意地按比例恢复,甚至可以被禁用,以便传送音频信号原始的动态范围。 |
这种独特的消费者端动态范围处理方法使得厨房里的DTV电视机具备有限的动态范围,从而使得宁静的音频能够盖过背景噪声而被人们听到;同时,客厅里的大屏幕DTV电视机则具有无限制的动态范围,并能够压倒背景噪声(可能还有邻居的声音)。DRC有助于在几乎所有的聆听环境中,提供最佳表达的节目内容,而这与设备质量、声道数目或环境噪声电平无关。 |
Dolby Digital码流中携带解码器两种可能工作模式的元数据。这两种工作模式由于正常情况下与其有关联的输出类型而分别被称之为线路模式和射频模式。线路模式是相对轻度的动态范围压缩,通常用于具有六声道或双声道线路级输出的解码器中;射频模式用于诸如机顶盒之类的具有射频再调制(即3或4频道)输出的产品中。射频模式是较重度的动态范围压缩,其峰值受到限制,以避免电视接收机中出现严重的过调制。全功能解码器允许消费者选择是否使用DRC,以及使用量。值得高兴的是,消费者看到的是简单的选项,如关闭、轻度压缩和重度压缩,而不是无压缩、线路模式和射频模式。 |
在Dolby Digital系统中,有6个预置的DRC设置文件可供使用:Film Light(影片轻度压缩)、Film Standard(影片标准压缩)、Music Light(音乐轻度压缩)、Music Standard(音乐标准压缩)、Speech(语音用压缩)和None(无压缩);而且每个文件都可以单独选择用于线路模式和射频模式。电视台,或更准确地说是节目提供者,选择将这些配置文件中的哪一个指配给每个模式。在消费者或解码器选择一种DRC模式(也就是说完全施加、完全不施加或在中间某处施加DRC)后,所选择的设置就被施加于被解码的音频信号上。 |
此外,通过使用过载保护元数据,可以限制信号峰值,以防止缩混过程中出现削波。例如,一个在所有声道上信号均接近数字满标度的5.1声道节目正在通过立体声机顶盒播放。如果没有某种形式的衰减或限幅,则随着5.1声道信号被缩混成立体声信号,输出信号显然将出现削波。合理地设置对白电平和DRC参数可以防止削波,但仅仅是在个别情况下,DRC才会起作用并保持控制,尽管最好是避免这种情况出现。值得指出的是,即使是在选择了“None”设置的情况下,保护DRC仍是有效的。 |
|
缩混 |
| 图2 一旦对白电平设置用于解码音频 所有节目被"调整"或标准化 注意信号峰值不受此影响
广告
|
|