前言
视频不断向前发展。黑白视频最终让位于标清彩色视频。反过来,色彩范围有限的SD让位于更高分辨率及更多和更丰富色彩的高清。技术继续发展,更高分辨率和更深色彩的超高清正在向我们迫近。视频演进的下一步是高动态范围(HDR),它是一个旨在增加视频的颜色数量和亮度,更接近于在自然界人眼可视景物的新兴标准。
目前有三种在近期可能用来改进视频体验的技术:提高视频帧率、增加每帧的像素数,和/或改进像素本身。本白皮书聚焦于第三种方式,并且论证在当前的标准化格局不确定的情形下,以软件支持HDR是适合视频生态系统的最佳途径。
HDR:正在进行的工作
当前视频领域很多令人兴奋的工作集中于改善像素和通过付费电视、因特网、卫星及其它视频工作流程精确传播这些改进,以便在市场中越来越常见的4K监视器上产生光泽鲜艳的图像。
支持HDR的标准制定是正在进行的工作。由于技术和商业的原因,业界尚未就标准的形态达成共识。基本问题依然围绕着HDR元数据的编码、传输和解码方式。细分行业(如付费电视提供商和支持他们的内容所有者)是繁荣兴旺还是受到挑战,取决于最终采纳的一系列规范。
悠久的历史
把电子信号转化为接近于真实世界的彩色的努力与电视广播的历史一样悠久。色彩研究在彩色电视出现几十年前就开始进行了,但研究被第二次世界大战中断。1931年,国际照明委员会(CIE)制定了CIE 1931 RGB彩色空间和CIE 1931 XYZ彩色空间。60年后的1990年,高清电视标准被用ITU-R Rec.709确定下来。它把色域限制于CIE彩色空间所要求的一个相对狭窄的区域。2012年,ITU Rec.2020(UHD)颁布。高动态范围是实现Rec.2020可获得的扩展彩色空间的一个努力。

图1 - Rec. 2020为高动态范围视频提供扩大的彩色空间
每一个比特都有用
可被显示的颜色数量被称为色彩深度或位深度。色彩深度或是被用于表示位图图像或视频帧缓存内一个像素的比特数量,或是被用于一个像素的每个彩色分量的比特数量。当使用8比特像素时,有256的色彩深度。对由10比特组成的像素,色彩深度跳到1024。色彩深度翻两番不仅增加颜色深浅度和层次,而且使色系内的色彩转换更平滑。这可能非常关键:在8比特环境中,可能出现人为的分级现象,可见到从颜色的一个梯度渐变到另一个梯度。本质上10比特像素提供更接近与人类能够感知的极限的一系列颜色;而且这种情况是平滑出现,没有可见的失真。

图2 – 10比特色彩深度呈现色系内平滑的色彩过渡
增加比特数是改善像素的很好的第一步。然而,它却意味着很少其它同样重要的改变。一个与向像素增加比特密切相关的演变是总体显示技术的改进。阴极射线管(CRT)使用电子枪和荧光屏显示图像,是数十年来电视显示屏的唯一选择。同样,一些液晶显示器(LCD)仅在两个位置背光照明。如果一个明亮的事件出现在屏幕上,生成的图像会相当过饱和。此画面几乎肯定不会像内容创造者所预期的那样“抢眼”。这些图像过不了眼睛这一关。
这个问题通过具有局部或均匀散布的背光照明能力的现代LED或OLED得到缓解。使用这些显示器,亮和黑之间(夜间海滩上的篝火火焰对远方大海的黑暗之间)的转换均匀地更极致、更鲜明、更生动。

图3 – 增加色彩深度降低可见条带效应,产生平滑的渐变。
一个构成转向HDR的基础的相关进展是基础设施理解和数学表现编码图像的性质以及在解码过程中利用该信息的提高的能力。历史上,一个称为伽玛曲线的技术被用于将来自编码器(和艺术指导)的指令传输到显示器。不过,此伽玛曲线是CRT时代另一个遗物。它不再与当前的现代显示器有关系。
HDR提供一种通过元数据描述和保护内容创作者意图的方式。本质上它包含一种内容创作者用来指示解码器的语言。HDR以有序的方式提供关于内容创建方式的元数据给显示设备,因此显示器能够最大化自身的能力。随着显示器的发展,HDR将允许现有设备始终尽最大努力呈现图像,而不是遭遇不可行的限制。
一个被称为电光传递函数(EOTF)的方式被引入以取代CRT的伽玛曲线。一些工程师把EOTF更简单地称为感知质量或PQ。不管什么名字,它都按照内容创作者给出的指示提供更具粒状的亮度映射呈现方式。EOTF是高效率视频编码(HEVC)标准的一部分。
在HDR中采用EOTF特别重要,原因是端到端工作流程——从摄像机、到编码器和分配路径,再到解码器以及最终的电视屏幕,要求内容经过许多转换。不同的标准(有些相对新,有些沿用已久)被用于分配路径中的不同节点。EOTF是确保通过这些阶段质量不会降低的方式,并且提供评估视频内容的艺术完整性是否得以保持的至关重要的高水平手段。
从科学到实践
视频业面对的下一个大挑战是将HDR背后的科学转化为能够确实完成消费者要求的使HDR成为现实的任务且为提供商提供投资回报的一个系统或多个系统。这增加了从实验室到市场的复杂性。

图4 – 标准动态范围 对比高动态范围视频
了解现状以及HDR处于发展初期很重要。存在相当多的HDR解决方案,但它们之间技术差别很大。它是刚刚兴起的行业的一个方面,但与此同时,内容创作者和厂商希望快速利用市场营销者通过HDR显现出来的极佳的概念。此外,电视机厂家正在向消费者推销HDR,希望增强4K电视产品且有更高的零售价格。
离有一个既适合传统又适合OTT分发的基于标准化的HDR方案的稳定环境还需要一段时间。当前,端到端解决方案刚刚开始出现。此外,还无法说哪个方案获得各个行业赞成。在缺乏这样的基本信息时,付费电视公司(有线电视运营商、电信公司等)可能根据本地因素以及他们的企业所有制和联盟的利害关系要求不同的解决方案。在缺乏行业共识时,可能出现一个内容提供商和所有者必须支持多种文件库和工作流程的局面。这种情况(它在自适应码率流媒体领域中已经逐渐消失)效率极为低下。
有很多实体提出了解决方案。飞利浦、杜比、特艺和BBC/NHK以及不知名的实体都有候选方案。还可能涌现其它解决方案。迄今为止最值得关注的基于标准的方案是HDR-10(往往也被称为普通HDR),它是来自SMPTE的规范之组合。其它组织(如ETSI)正在致力于制定完整或分系统。MPEG正向其HEVC标准增加补充增强信息(SEI),以支持HDR。当然,这些竞争的方案正在幕后推进,以使他们的知识产权成为基于标准的方案。
方案之间的差异细节颇为显著,但在较高层面,有两个主要考虑。首先是某一系统是否向后兼容(即它是否使用现有的编码/解码设备)。其次是HDR和SDR向后兼容元数据如何传输。至少可以这样说,它们都很重要。
向后兼容性
对某些付费电视公司、分配商和设备制造商来说,选定一个不需更换编码器/解码器的方案是非常重要的。Dolby Vision、特艺、飞利浦和BBC/NHK全都为向后兼容。在向后兼容方案中,当一台SDR电视机收到视频信号时,HDR元数据就被机顶盒或显示器忽略。
但是,并非所有HDR潜在客户关心向后兼容性。在某些分配生态系统中(如OTT和蓝光2),很少出现向后兼容性问题。因此,可能出现的一种情况是支持HDR将要求换掉编码器、解码器和有线电视机顶盒。由于可能必须保持两套内容(SDR和HDR),非向后兼容方案无疑将导致此生态系统的各个成员产生高昂成本。
单层或双层
方案之间的另一个差异是元数据通过工作流程的方式。在双层方案中,SDR和HDR视频流单独通过工作流程。在单层方案中,额外的元数据(它们必须加到SDR使之成为HDR)被集成进单层及靠边元数据内。
双层方案的挑战是传统的系统(编码器、电视机、机顶盒等)希望单一视频流。第二视频流的引入使重要的辅助业务(如紧急信息发布、屏幕显示以及广告拼接和插入)较为困难。双层方案提供最高质量的观看体验,没有数据大小的限制。单层方案较适合现有的视频工作流程。

图5 – HDR解决方案比较
最后一个关注点是行业必须选定在短期内使实时HDR可行的方案。这特别重要,原因是直播体育将成为HDR的一个主要的展示橱窗和推动因素。例如,如果一场足球赛在一个区域是明亮而另一个区域较暗的球场(如由于看台导致的阴影)进行,HDR使球场全部区域看上去都同样清晰。相比之下,为确保满意的观看体验,采用SDR则须做出看清球场哪个区域的取舍决定。
结论:软件是关键
HDR的优点极大,业界希望尽快把它们提供给客户。有影响力的公司正在推出可行的HDR实施技术,而另一些公司正在敦促开放方案,旨在防止行业陷入分裂阵营(结果像VHS对Betamax或蓝光对HDDVD的局面)。
澄清并解决这些问题需要一些时间,也无法保证将对单一HDR方案达成一致意见。这对内容所有者特别重要。例如,一个内容所有者可能被要求以两种不同格式为两个不同的分配商提供HDR内容。当内容创作者尝试出售其内容库供再使用和再播出时,这可能是一个问题。
不过,此似乎棘手的难题有一个简洁的答案。它很简单,能让内容制作者和负责编码内容的公司商业上开心,并未来无忧。用Elemental的视频解决方案建立一个基于软件的基础设施,现在就可实施全新和鲜亮的彩色和亮度标准,无需做昂贵的决定或维持运行平行的基于硬件的HDR孤岛。
HDR是视频总体发展的一个关键要素,并且是一个多种因素持续重组发展的宏大蓝图远景的一部分。在这样一个环境中,尽可能使更多部件以软件形式实现是一个优势:它降低资本和运营开支。Elemental采用软件定义的解决方案应对HDR挑战。Elemental灵活和可扩展的软件之设计利用云的通用处理能力和优势,无需大的硬件投资,就能最大地完成视频处理和分发任务。