更深入地探讨音频元数据(2)
2002-12-27
Tim Carroll 依马狮商务网
上期我们探讨了音频元数据的:对白电平、动态范围和缩混,并讨论了消费和专业元数据之间的差别。本期我们将讨论实质问题并试图回答下面三个问题:这些及其它元数据参数是如何及在哪里生成的?元数据是如何从其生成位置一直传输到将在其上传送给用户的Dolby Digital(AC-3)编码器处的?最后,如果没有元数据,或如果元数据被不正确地设置,结果会怎样?系统理论上看上去好极了,在许多情况下也行之有效,但这三个问题提出了一些必须解决的重大实际问题。 |
在深入探讨之前,我很想提出另外两个我们上期没有讨论,但也很重要的元数据参数。第一个称为音频编码模式(acmod),它描述的是存在的声道的数目和类型。其表示方法是前声道/后声道,如果存在LFE信号,则后面跟一个“L”。例如,一个2/0节目指的是有两个前声道,即左声道和右声道,此外没有其它声道;一个1/0节目指它是单声道,音频来自中心声道;一个3/2节目则是指左、中和右声道,以及两个环绕声道;3/2L则是指同一个节目但带有一个LFE声道。 |
第二个附加元数据参数称为杜比环绕声模式(dsurmod),它表示一个2/0(双声道)节目是否杜比环绕声编码。尽管此值是资料性的,但有些较新的解码器可能会在一个节目从3/2L切换到2/0时,用它来自动触发杜比环绕声解码器,保证全部5.1扬声器都能还音;更重要的是,使对白像前述那样居中。此值对于我的解码器无关紧要,但由于我将它设置为永远对双声道音频进行Pro Logic解码,所以它都是自动切换的。 |
|
元数据的编写 |
元数据可以用若干种不同的设备来生成或编写。从Dolby Digital(AC-3)的最先发布一直到约三年前,元数据一直都是通过某种用户接口在编码器内部设置的。27个参数导致至少27层菜单需要打开—绝对不适合无决断力的人。对用户来说好在这些编码器还有一组缺省值。然而,这一点有时对观看者来说则是不幸的,因为这些数值很可能是在杜比工厂里设置的,而且以后就没有人动过它们。 |
杜比后来开发了一种名叫DP570多声道创作工具的产品,供节目制作阶段使用。该设备使得元数据数值能够在产生最后混音的位置被编写出来。最重要的是,调音师借助它能够实时聆听正在进行的修改的效果。该设备可以模仿从全面的5.1直到单声(利用一个2英寸扬声器,如果使用者有的话)范围内的各种播放系统,并允许同时创作8个节目。值得高兴的是,DP570带有一个PC遥控程序,它提供对所有声道的计量,并允许相当直接地控制元数据和各种监听功能。目前,各地的后期制作工作室正在用它制作5.1声道节目,这些节目在HBO、Showtime、Starz! Encore等频道中都可看到。 |
|
分配 |
我们如何通过网络从后期制作室里获得这些元数据并将其传输到附属台的Dolby Digital (AC-3)编码器中呢?问得好,下面是几个一般性建议。 |
第一个建议,也是最劳心费神的建议,称之为人工传递网络。它包括利用DP570的遥控打印一份所有元数据值文件,然后将这几页纸人工传递至各个Dolby Digital (AC-3)编码器中(注意:一个节目有27个数值,所以最好只有几个节目),并用手工方法输入这些数值。 |
第二种方法包括使用另外一种称之为Dolby E的技术,之所以叫这个名字是因为它是在Dolby D (AC-3)技术之后出现的。Dolby E技术是在1999年开发的,它通过4个AES线对和元数据接收多达8个PCM声道的信号,并将它们编码成一个1.92Mb/s数据包,后者恰好适合于一个20比特48kHz AES线对的空间。只要数字路径中不包含取样率转换或电平漂移,Dolby E信号就可以像标准AES信号那样发送、切换和存储。重要的是,音频信号和元数据都作为一个信号保持同步,然后就在Dolby Digital (AC-3)编码器之前解码回基带PCM音频和元数据。 |
另外一种目前颇受欢迎的分配技术是将八声道的音频连同视频信号一起嵌入“高分辨率串行数字接口”(HD-SDI)中。你可能会问,元数据怎么办?事实证明,在HD-SDI信号中有一些额外的空间,它被称之为垂直辅助数据或VANC。音频元数据与隐含字幕数据一起被嵌入到HD-SDI码流的VANC空间内。此外,一个节目所有的音频、视频和元数据作为一个信号保持同步,此信号可以发送、切换和存储。 |
如果一家后期制作机构采用DP570来编写元数据,然后利用Dolby E或HD-SDI和VANC将音频和元数据存储在成品节目带上,那么它就可以被传送到网络中以便分配给各附属台。各附属台接收到此信号后会将之解嵌入和/或解码成基带PCM和元数据,将这些信号馈送至它们的Dolby Digital(AC-3)编码器,然后再将信号发射给用户;用户的接收机将解码音频信号,运用这些元数据并再现声音。图1表示此过程典型的信号流程。 |
| 图1 从节目制作到用户的简化信号流程 HD-SDI适用于嵌入音频和VANC空间中的元数据 |
|
|
元数据问题 |
我有一些令人惊动的消息要告诉读者。目前没有一个地面广播网为其附属台提供音频元数据码流。我知道你会纳闷,“但我一直在收看数字电视,而且声音听上去很正常呀”。的确如此,信号里确实有元数据—记得Dolby Digital(AC-3)编码器中有一组缺省值,它们在编码过程中被插入到码流中。 |
实际情况是这样的:如果Dolby Digital (AC-3)编码器接收到一个有效的元数据码流,它会使用其中的某些信息来配置编码器,并将其余部分与编码音频相结合,生成一个完整的Dolby Digital AC-3码流,该码流将被传送给用户。如果编码器没有接收到有效的元数据码流(原因有二,或者是该码流根本没有被发送,或者是数据出错。),则编码器可以继续使用它上次接收到的有效元数据数值或恢复成内部预置的数值。尽管这样能维持某种音频的播出,但最好的情况也不能优化音频,最坏的情况则是出现某些声道的丢失。 |
由于这种行为是用户可配置的,所以我极力建议在你开始传递来自网络或其它来源的外部元数据之前,一定要对你所做的选择给予认真的考虑。如果元数据由于某种原因而消失,你一定不希望对白因为编码器在一个3/2节目期间跌落回2/0(中心声道将被漏掉)也随之消失。在绝大多数情况下,我建议将编码器设置成恢复到与最大节目同样“大”的数值。这就意味着至少要将音频编码模式设置为3/2或3/2L,将对白电平设置为-27。其它数值不像这两个数值那么重要,可以保留其缺省值。 |
我最经常被问到的问题之一是:“如果有人想欺骗系统,故意不正确地设置对白电平的数值,以便使某个节目或商业广告超过其应有的响度,会发生什么事情呢?” |
扼要地说,对白电平元数据参数表示某一
广告
|