概述
杜比数字+(Dolby Digital Plus)和杜比睿波(Dolby Pulse)这两种多声道音频格式因为不同的原因对下一代广播充满吸引力,这两种格式都有可能在欧洲用于新的服务。
最重要的新制定的欧洲高清电视接收器规范都包含杜比数字+和杜比睿波。
杜比正在开发一款新的多格式音频解码器,它将使新式的接收机可以轻松集成两种解码器。
广播商和运营商的要求
在过去18个月当中,欧洲的各行业组织或集团如DVB、EBU、EICTA和一些国家级的高清电视规范论坛考虑选择一些音频编码系统应用于下一代广播,包括使用MPEG-4视频的高清电视节目。总的说来,他们青睐两种已经标准化的音频编码系统,认为这两种系统特别适合下一代传输方式,这两种系统分别是杜比数字+(即E-AC-3)和杜比睿波(集成了aacPlus或HE AAC)。比如,欧洲广播联盟(EBU)的D/MAE项目组所做出的结论是这两种编码格式是通过卫星、有线、地面和网络电视网络广播HDTV音频服务的最佳选择。
通常来讲由于不同的广播商/运营商有着多种不一样的市场要求,各种技术的特性组合也各不相同,要让这些项目组共同推荐一个适用于一切应用的音频系统是不可能的。例如,杜比数字+当前对5.1声道以及先进的元数据提供完善的支持。杜比睿波在不久的将来也会提供这种支持,此外它已经具备令人敬畏的编码效率,现在该技术也使得以极低的数据码率传输高品质的立体声服务成为了可能。
此外,超过200种欧洲电视服务已经采用传统的杜比数字(Dolby Digital)音频进行广播,所以下一代的接收机显然需要兼容这种格式。
欧洲高清电视接收机规范
虽然DVB没有规定下一代广播应该采用哪一种音频编码器,但是最近各种广播商/制造商小组已经在广播商们所青睐的格式上取得了一致意见。
高清地面电视规范 |
杜比数字+ |
带转码器的HE AAC |
DTG高清数字地面电视(英国) |
√ |
√ (不要求有转码器) |
EBU(Tech 3333) |
√ |
√ |
EICTA(即数字欧洲) |
√ |
√ |
法国HD DTT |
√ |
√ |
爱尔兰HD DTT |
√ |
√ |
意大利HD DTT |
√ |
√ |
NorDig HD DTT(丹麦、芬兰、冰岛、挪威和瑞典) |
√ |
√ |
波兰HD DTT |
√ |
|
RiksTV(挪威地面广播) |
|
√ |
斯洛文尼亚HD DTT |
√ |
√ |
西班牙HD DTT |
√ |
√ |
注示:HD=高清,DTT=数字地面电视。关于最新情况请浏览www.dolby.com/EuroHDTVSpecs。
表1欧洲高清电视规范中的多声道格式要求,2009年6月。
注
1. 欧洲广播联盟(EBU)的D/MAE项目组声明杜比数字+和杜比睿波是广播高清电视的最佳选择。该项目组称杜比数字+和杜比睿波都有优势,目前不能确定哪一种格式能够胜出。数据码率为448kbps以上时杜比数字(+)性能优良而稳定;当数据码率有限时HE AAC的性能极佳。
2. EICTA高清电视接收机规范要求采用带转码器输出的杜比数字+或杜比睿波。尚未确定通用的音频解决方案,所以实际上两种格式都会采用,除非制造商能够确定在产品行销的所有地域只采用一种格式进行传输。
3. 鉴于从2008年10月启用服务之后要求有(集成下混合功能)的HE AAC多声道解码器,在2009年12月31日后要求集成HE AAC转码器。
4 . NorDig要求采用双解码器,除非运营商能够保证单一的音频格式能够在整个产品市场范围内被使用。
[Page]
新的多格式音频解码方案
在2007年11月,杜比实验室并购了Coding Technologies(科汀)公司,该公司是HE AAC标准的主要贡献者。杜比打算面向市场推出一款新的可许可使用的音频解码器,这款解码器在一个方案包中同时支持杜比数字+(包括杜比数字)和杜比睿波。
这一元器件(implementation)将降低在新式接收机中集成所有音频技术的复杂性与成本。它也会简化产品的开发与测试,同时满足当前对于下一代高清电视服务的要求。

图1
Dolby Digital or Dolby Digital Plus or Dolby Pulse:杜比数字或杜比数字+或杜比睿波 |
Dolby Pulse decode:杜比睿波解码 |
Audio and metadata:音频与元数据 |
Dolby Digital encode:杜比数字编码 |
Dolby Digital /Dolby Digital Plus decode/convert:杜比数字/杜比数字+解码/转换 |
Stereo outputs:立体声输出 |
Dolby Digital bitstream for existing home cinemas:为现有家庭影院提供杜比数字比特流 |
Mixing metadata:混成元数据 |
Pass-through on HDMI:通过HDMI接口 |
杜比MS10多码流解码器将具备以下关键优点:
给广播商提供一个通用的解决方案,让他们可以灵活地选择最适合其需要的格式:杜比数字(Dolby Digital)、杜比数字+(Dolby Digital Plus)、或杜比睿波(Dolby Pulse)。
轻松实现安装,因为可交付件、技术支持和测试都可以从杜比得到。
与现有的杜比数字+、杜比睿波和转码器方案相比可以节省认证费用。
完全兼容杜比元数据,以及具备所有不同传输格式的消费者现有的DVD家庭影院系统。
在杜比数字和杜比数字+解码与转换之外还为杜比睿波提供充分的多声道支持(转码器)。对所有输入格式实现一种杜比数字输出。
支持以“接收机混成”风格提供音频描述服务,可以同时使用两个杜比睿波、杜比数字、或杜比数字+的实例——但只按一个解码器收费。
支持多节目杜比数字+码流(在同一股音频流中提供主音频和伴随音频)。
解码器/转码器和转换器集成在一起可以在一个产品中整合解码杜比数字、杜比数字+和杜比睿波的功能。为产生主音频而进入解码器的所有的这些输入信号不经任何改变就通过HDMITM和S/PDIF接口输出(杜比数字+转换成杜比数字;杜比睿波信号在确定好接口后就会通过。)* 为了产生伴随音频而进入解码器的信号不会通过系统,但是会经过解码后送入混成引擎以支持接收机混成风格的音频描述。
同时,为了支持广播设备的解码输出(比如,模拟输出)一定会从任何输入格式中产生两声道下混合。
为了实现S/PDIF和HDMI接口的最大兼容性与连通性,集成了一个多声道解码器可以给内置的杜比数字编码器提供多声道信号(多达5.1声道),接着以固定的640kbps的比特率输出标准的杜比数字比特流(多达5.1声道)。
杜比数字和杜比数字+输入信号由集成式杜比数字+解码/转换器进行处理。这样可以为解码输出提供两声道缩混的同时将杜比数字+码流转换成杜比数字信号,最大程度地实现对S/PDIF输出的兼容。
杜比MS10多码流解码器支持分别为杜比睿波和杜比数字/杜比数字+同时解码主音频和伴随音频,以支持基本的两声道混成(双解码模式),满足欧洲的下一代音频广播规范。但是,系统将会把杜比数字+中可能携带的混成元数据在其中的一个输出端上作为串行比特流提供。这种混成元数据将用于控制外置/系统级模块中的混音。实施这种双解码(双解码模式)只是可选项,但还是强烈推荐实现这种功能。
通过HDMI或S/PDIF接口传输杜比睿波码流在未来随着跨越这些接口传输的必要技术规范得以完善将成为可能。
比较各种AAC与杜比睿波
杜比睿波是MPEG-4 AAC音频编解码系列技术的加强和优化版本。杜比设计它的目的是为了提高这种格式的功能性、灵活性与可靠性,同时充分保持向前向后的兼容性,它完全兼容ISO/IEC 14496-3:2005中定义的MPEG-4 AAC、MPEG-4 HE AAC、和MPEG-4 HE AAC v.2。
先进音频编码(AAC)是一种为了实现高效存储与传输而开发的用于压缩数字音频的感知编码方法。在还音时,经过解压的文件所提供的音质与原始音源几乎无法区分。就原理而言,AAC与MP3类似,但是它还具备一些优势:
更高效的压缩
更高的取样率
更好的频率响应
更多声道
为了提高编码效率并降低比特率,HE AAC增加了频带复制(SBR)技术。除了SBR之外,HE AAC v.2使用参量立体声(PS)来进一步增强效率和降低比特率,它传输带有参量信息的单声道,然后从中提取出立体声。SBR和PS都具有向后与向前的兼容性。所产生的结果是HE AAC以160kbps的比特率能够带来5.1音频,以32kbps的比特率带来接近CD音质的立体声,以24kbps的比特率提供品质优良的立体声。
杜比睿波以AAC系列编解码技术为基础。杜比睿波解码器包含一个HE AAC v.2解码器,它能解码AAC、HE AAC和HE AAC v.2比特流,从而发挥出这些技术的全部潜力。
杜比睿波和标准MPEG-4 HE AAC之间的主要区别在于是否支持音频元数据。MPEG-4 HE AAC技术规范描述了一些可选的元数据参数,用以控制诸如机顶盒与电视机中的消费类设备中的音频信号的复制。
杜比睿波集成了让系统发挥广播音频系统之功能所需的一切元数据参数,如杜比数字和杜比数字+。在以下方面它也提供一些重大的改进:
解码器的稳定性:与一般的HE AAC元器件相比,杜比睿波大大优化了切换声道配置的时间,在使用带有杜比睿波编码器的系统时,还提高了可靠性。
误码掩盖:杜比睿波增加了精妙的误码掩盖机制,可以确保可靠的广播音效。
解码器对于内存与计算复杂性的要求:杜比多码流解码器平台内的杜比睿波解码已经整合进入针对H.264片上系统(system-on-chip)架构而优化的合并代码库。
编码器音质:杜比睿波所提供的音质优于其它参量音频编解码器的音质。
既然在基于MPEG-4 AAC的比特流中加入音频元数据只是可选项,那么杜比MS10多码流解码器的优点就在于在其转码器中有这么一种机制,当流入的标准的MPEG-4 HE AAC比特流不包含元数据,在解码这种比特流时该机制能够优化音质。只有当杜比多码流解码器所处理的杜比睿波码流时由适当的杜比睿波编码器所产生时,整个广播系统才能实现最佳的性能。
杜比多码流解码器能把多种AAC内容处理成PCM,同时将该内容转码成杜比数字格式用于多声道码流的输出。得到支持的AAC格式包括:
杜比睿波
aacPlus
MPEG-2/4 AAC
MPEG-4 HE AAC
MPEG-4 HE AAC v.2
[Page]
最初设计杜比MS10多码流解码器平台时只支持DVB设备((LATM/LOAS格式)。但是在源代码的可交付件中已经包含对在为ARIB(ISDB-T)系统而设计的广播系统中使用杜比多码流解码器的支持。要充分支持ARIB就需要对元器件开发工具包(IDKs)和系统开发工具包(SDKs)进行修改。

Dolby Pulse:杜比睿波 |
aacPlus |
HE AAC |
(including AAC):(包括AAC) |
图2 杜比睿波的特征集超越任何现有的AAC解决方案同时充分保持向后兼容性并符合MPEG-4规范
对杜比睿波拓展特性的支持是在专用的代码库中实现的,该代码库是杜比MS10多码流解码器的一部分。这种扩展后的代码库提炼出了现有的HE AAC或aacPlus解码器的功能与可靠性,因此它是杜比多码流解码器的重要而独特的成分。但是,杜比多码流解码器对所有的AAC元器件与比特流提供充分的向后与向前兼容性;杜比多码流解码器总是能够解码任何形式的AAC音频,同时杜比睿波码流可以在任何HE AAC解码器平台上解码(尽管在功能与形状上有所降低)。
广播混成vs接收机混成
广播服务提供音频描述为时已久。比如PAL制式就实现了第二调频伴音副载波来承载第一调频副载波上所携带的主音轨的另一个版本,通常第二调频伴音副载波用来承载立体声传输中的右声道。尽管这种“广播混成”的方法仅限传输单声道主音轨和伴随音轨,但它是为视障人士提供基本服务的高效方式。图3显示的是欧洲广播商用来标记那些提供音频描述服务的传输方式的标志。
图3 欧洲广播商用来标记那些提供音频描述服务的传输方式的标志
这种广播混音法是在传输之前的后期制作中将主音轨与评论音轨进行混成,数字电视系统仍然沿用这种方法,因为早期的接收机只具备基本的功能,而数字传输的节目源经常仍然储存在模拟介质上。这种方法也与NTSC系统所采用的方法类似,NTSC系统的副音频节目(SAP)将主音轨与音频描述音轨的预混版作为单声道信号携带。但是由于美国国内的附属广播架构问题,存在着一些技术上的阻碍因素干涉SAP信号通过有线和卫星系统进行传输,因此观众不太能够享受到这种服务。
许多欧洲的公共广播商所提供的大部分节目都带有音频描述服务,他们正面临着继续以“模拟风格”传输其音频描述服务的挑战——就是说,仍然把主音频放在左声道上,把音频描述放在右声道上,基本上就是将主广播音轨作为立体声携带但是作为双单声道信号处理。这就要求广播接收机只将左声道或右声道传给其音频输出端。但是因为这不是DVB的要求,DVB强制规定不同的音频服务必须使用不同的音频PID进行传输和信号处理,因此接收和录制这些服务就成为了一项大的挑战。
时至今日,在很多国家以广播混成方式传输音频描述服务已经成为一种标准的做法。为了通过更高效的方式以接收机混成法的形式为视障人士提供服务的诸多努力最终促成了一项规范的产生,该规范现已成为DVB的一部分。
ETSI TS 101 154的附录E描述了将包含描述音轨的分离式单声道信号与主音轨作为单独的比特流一并传输的基本方法。合适的广播接收机可以接下来在设备自身以内将主音轨与评论音轨混成,因此产生了“接收机混成”这一术语。
图4显示的是支持为杜比MS10多码流解码器所支持的音频编解码器进行混音的接收机混成架构以及来自其它来源的架构,如MPEG-1 Layer II。

图4
Main:主音频 |
Associated:伴随音频 |
Set-top box/TV:机顶盒/电视 |
Dolby MS10:杜比MS10 |
Transcode:转码 |
Decode:解码 |
Dolby Digital bitstream (unmixed):杜比数字比特流(未混成) to S/PDIF and/or HDMI:发给S/PDIF和/或HDMI接口 |
Two-channel PCM:两声道PCM |
to analog and/or S/PDIF, HDMI:发给模拟输出端和/或S/PDIF、HDMI输出端 |
Two-channel PCM:两声道PCM |
Two-channel PCM mixer for AD:用于模数转换的两声道PCM混音器 |
to analog and/or S/PDIF, HDMI (mixed):发给模拟输出端和/或S/PDIF、HDMI输出端 (已混成) |
Mixing metadata:混音元数据 |
[Page]
混音架构
将作为子码流传输的伴随音流与主广播音频或者单独的低比特率音流进行混成使得为视障人士提供音频描述服务或者提供导演评论这样的服务成为可能,与此同时保持了尽可能高的带宽利用效率。
这种接收机混成法不需要广播商传输几种成品混音来支持多种观众偏好。它只需要增加包含附加信息的低带宽子码流与混音元数据,这些信息决定着伴随音流在接收设备中如何同主广播音轨结合。欧洲的公共广播商对于该特性在未来的应用有着很强的需求,它也能给广播设备增加另一项差异化特性,有助于驱动下一代数字电视服务在全球范围内的成功。
音频服务 |
编译码器 |
子码流的运用 |
声道配置 |
主音频 |
杜比数字(AC-3) |
N/A |
多达5.1声道 |
杜比数字+(E-AC-3) |
独立子码流0 |
多达7.1声道 |
杜比睿波(aacPlus) |
N/A |
多达7.1声道 |
伴随音频:作为主音频服务在同一比特流中传输(在ETSI TS 102 366中有说明) |
E-AC-3 (主音频必须是AC-3或增强版AC-3) |
独立子码流1 独立子码流2 独立子码流3 |
多达7.1声道 |
伴随音频:在单独的MPEG PES中传输 |
E-AC-3 (主音频必须是AC-3或E-AC-3) |
独立子码流0 |
多达7.1声道 |
aacPlus (主音频必须是aacPlus) |
N/A |
表2杜比MS10多码流解码器所支持的主音频和伴随音频的输入格式
该设计支持将一种主音频服务与一种伴随音频服务混成。通过使用附加的独立子码流,伴随服务可以与主服务一起在相同的E-AC-3比特流中传输,或者作为E-AC-3比特流传输由单独的MPEGPES携带。如果是杜比睿波,则伴随音频服务作为E-AC-3比特流传输由单独的MPEGPES携带。

Mixing metadata:混音元数据 |
Main audio:主音频 |
Assoc. audio:伴随音频 |
User level adjust:用户音量调节 |
图5 混音器:2/0主音频,1/0伴随音频(启用声音转向元数据)
<>
Multichannel bitstream:多声道比特流 |
Main audio decode and downmix:主音频解码与下混合 |
Mixing metadata:混音元数据 |
Multichannel bitstream:多声道比特流 Assoc. audio decode and downmix:伴随音频解码与缩混 |
User level adjust:用户音量调节 |
图6 混音器:2/0主音频,1/0伴随音频(禁用声音转向元数据)[Page]
伴随音频服务的类型信息携带在杜比数字+或杜比睿波的描述符中,在流入的MPEG-2传输流的节目映射表(PMT)中可以找到这样的描述符。
用于广播服务的每一杜比数字+或杜比睿波码流都有一个识别描述符,广播接收设备通过该描述符告诉用户哪种伴随音频服务是可用的。当用户选择想要的服务时,广播接收设备将它从MPEG传输流中解复用,并将它传给杜比MS10多码流解码器。以下的例子阐明了在实际工作中这种方法是如何起作用的。

Demux:解复用 |
Dolby Digital Plus main:杜比数字+主音频 |
Dolby Digital Plus associated:杜比数字+伴音 |
Dolby MS10 Multistream Decoder:杜比MS10多码流解码器 |
Two-channel PCM main:两声道PCM主音频 |
Two-channel PCM associated:两声道PCM伴音 |
Mixing:混音 |
图7 主音频和伴随音频以杜比数字+格式在单独的基本数据流中传输
用户通过杜比数字+描述符选择单独的MPEG PES中所携带的伴随音频服务以及相关的主音频服务(参图7)。广播接收机对来自广播传输流的这两股杜比数字+数据流都进行解复用,并将它们传给杜比多码流解码器的两个输入端。解码器从广播接收设备的系统层收到有关用户的音流选择信息,激活两股输入流,接着对它们进行解码和混成。包含伴随音轨的杜比数字+比特流中携带着混音元数据。

Demux:解复用 Dolby Digital Plus main and associated delivered as multiprogram stream:杜比数字+主音频和伴音作为多节目码流传输 |
Dolby MS10 Multistream Decoder:杜比MS10多码流解码器 |
Mixing:混音 |
图8 主音频和伴随音频以杜比数字+格式在一股多节目基本数据流中传输
用户选择杜比数字+主音频流中一个独立的附加子码流中所携带的伴随音频服务(参图8)。广播接收机只对主音频比特流进行解复用,同时杜比MS10多码流解码器从广播接收设备的系统层收到有关用户的伴随服务选择信息,并且只激活其主音频输入。接着解码器使用主音频链中的子码流解析器使独立子码流0(主音频)与携带伴随音频的独立子码流分离开来。然后伴随音频服务在解码器内路由到混音器的伴随音频输入端,两股独立子码流都会经过解码与混成。包含伴随音轨的杜比数字+比特流中携带着混音元数据。

Demux:解复用 |
Dolby Pulse main:杜比睿波主音频 |
Dolby Pulse associated:杜比睿波伴音 |
Dolby MS10 Multistream Decoder:杜比MS10多码流解码器 |
Two-channel PCM main:两声道PCM主音频 |
Two-channel PCM associated:两声道PCM伴音 |
Mixing:混音 |
图9主音频和伴随音频以杜比Plus格式在单独的基本数据流中传输
用户通过杜比睿波描述符选择单独的MPEGPES中所携带的伴随音频服务以及相关的主音频服务(参图9)。广播接收机对来自广播传输流的这两股杜比睿波数据流都进行解复用,并将它们传给杜比MS10多码流解码器的两个输入端。解码器从广播接收设备的系统层收到有关用户的伴随服务选择信息,激活两股输入流,接着对这两股杜比睿波比特流进行解码和混成。混音元数据携带在杜比睿波比特流的PES头端信息中,它们必须传递给广播接收设备的系统级解析器中的解码器。
完整的系统架构
杜比也在开发专业的多声道编码解决方案,其目的是进一步简化杜比睿波在广播中的应用,包括全力支持杜比元数据并兼容现有的杜比E基础设施。

杜比数字编码器 |
杜比数字比特流 |
杜比MS10多码流解码器 |
杜比数字+编码器 |
杜比数字+比特流 |
杜比睿波编码器 |
杜比睿波比特流 |
普通AAC或HE AAC编码器 |
AAC、HE AAC比特流* |
图10 杜比多码流解码器支持杜比数字+和杜比睿波系统内具有最大化特性与功能性的杜比系列广播比特流
一般的AAC和HE AAC码流会得到支持,但是仅限于ISO/IEC 14496-3:2005中所规定的基本功能。
结论
由于广播商们的要求各不相同,杜比建议下一代接收机的规范通常应该包含杜比数字+和杜比睿波解码。这符合许多欧洲广播商/制造商集团最近发布的规范,这些规范没有确定一个获得青睐的音频选项(参第2页的表)。杜比MS10多码流解码器将显著降低设计和制造包括双音频解码器在内的接收机的难度。
尽管杜比实验室打算面向市场推出杜比多码流解码器(Dolby Multistream Decoder),但是杜比实验室保留随时决定不推出杜比多码流解码器的权利,或者即使推出杜比也有权更改其价格、特性、技术参数、功能、性能、许可条款、发布日期、通常的可获得性、或者其它特征。
资料来源
Standards document ETSI TS 102 366, V1.2.1, “Digital Audio Compression (AC-3, Enhanced AC-3) Standard,” August 2008.
标准文档ETSI TS 102 366, V1.2.1,《数字音频压缩标准(AC-3, Enhanced AC-3)》,2008年8月。
Standards document ETSI TS 101 154, V1.8.1, “Digital Video Broadcasting (DVB):
Specification for the Use of Video and Audio Coding in Broadcasting Applications Based
on the MPEG-2 Transport Stream,” January 2007.
标准文档ETSI TS 101 154, V1.8.1,《数字视频广播(DVB):在基于MPEG-2传输流的广播应用中使用视频和音频编码的规范》,2007年1月。
Louis D. Fielder et al., “Introduction to Dolby Digital Plus, an Enhancement to the Dolby
Digital Coding System,” 117th AES Convention, October 2004.
Louis D. Fielder et al.,《杜比数字+的介绍,杜比数字编码系统的增强版》,第117届AES大会,2004年10月。
Advanced Television Systems Committee, “Digital Audio Compression Standard (AC-3,
E-AC-3) Revision B, Document A/52B,” June 2005.
先进电视系统委员会,《数字音频压缩标准(AC-3,E-AC-3)》修订版B,文档号A/52B,2005年6月
Standards document ISO/IEC 14496-3:2005, “Information Technology—Coding of
Audio-Visual Objects—Part 3: Audio,” January 2005.
标准文档ISO/IEC 14496-3:2005,《信息技术——音频-视频对象的编码——第3部分:音频》,2005年1月。