2016年12月6-9日,全球跨媒体领域的饕餮盛会——NAB Show Shanghai在中国上海隆重开幕。以下是中国工程院的院士丁文华有关 4K/UHD 产业中HDR、3D Audio技术及标准的发言实录:
非常感谢王局长能给我一个机会在这次会上跟大家介绍一下,4K、HDR和3DAudio有关标准的情况,中国最具有创新能力的城市上海和NAB结合办了这次活动,还是非常有意义的。非常多的经验能够在这个平台大家共享,回到我们话题,应该讲4K或HD是我们广电界下一步很重要的发展方向,而在这个方面,实际上我们的末端产业发生了非常大的变化,这个应该从今年十月份来的数据能够看到,在今年出厂的电视当中,4K的渗透率达到24%,而且各方面预测都能够证明一个事实,就是到2020年,整个4K以上的大屏的渗透率会超过50%。而且今年全球的4K的生产量、出货量总体超过了5000台。我们大家都非常清楚, 4K是从我们现在的高清过度过来的,告诉我们从原来的标清过度到现在的所谓2K,我们现在的4K都是一个基本的意思,我们原来的SD或者HD都是8比特,现在已经10比特,这个显而易见。除此之外还有两个非常重要的因素,就是高动态范围,以及宽的色域,我们现在的中端显示器基于LCD为主,这块的显示实际上只是达到动态范围一千比十的三次方量级,我们4K的标准更宽,基于2020的标准。

除此之外按照全球是特别欧洲的发展,我们下一步的发展,还会往更高的真率发展,我们现在电影24P,在这个量级,我们现在的高清是50I,相当于25P的情况,到了4K进入到50P,往后还会达到100P的帧率,如果过去我们是单声道,双声道,下一步应该是所谓的三维声,更加给我们带来沉浸感的临场的体验。我今天的话题主要是想说,在4K产业中,HDR和3DAudio标准的情况。这张图大家能够看到,实际上我们在日常当中,从最黑的星光到最亮的感光直射,我们的人眼不能在一个时间看非常亮或者看非常暗,是通过一个滑动的瞳孔的收缩,控制在我们每次看到的光线在10到五次方左右,这是我们看摄像机的准则,我们摄像机业绩按十的五次方,相当于16档光圈进行电视或者电影制作的,但是整个的传输通道支持8比特,高亮度或者是超低暗度会丢掉。
进入HDR我们会打通整个端到端,全部支持十的五次方量级的,这么高的动态范围一定会通过一个光到电,电到光的变化,把这么宽的内容传递到我们最终的电视机前。从这块实际上可以看到,我们彩色的范围,首先现在基于标清里看到的是黄色的小三角,这个是我们说的ITU709的标准,当然现在定的2020的标准,是一个更广阔的范围,而整个的色图,是我们人眼所能看到所有彩色的区域,把这块区域如果再加上亮度,我们就会看到形成两个冰块,一个是小冰块,实际上是我们彩色空间,这个彩色空间里头的小方块是我们基于现在的HD的,或者是709色域的,外面大的冰块是我们基于高动态和2020彩色色域的,恰恰由于这两个冰块彩色空间的不一样,给我们提供更广阔的彩色空间,还有画面的高亮和低暗。
现在的国际标准到今年的七月份已经确定下来,确定了ITUBT2100的标准,其中确定了两条曲线,一条来自美国公司提出来的PQ,一条来自BBC和HK提出了HLG两条曲线,整个的标准的情况,日本也在2015年标准上定义HLG的曲线上,ATSC3.0适应广播宽带,相关的HDR的标准草案已经全部出来了,正在进行到最后的阶段,DVB十月份刚刚通过发布A157的蓝皮书,把端到端系统层的方案做了确定。MPEG已经做了HDR相关传输的建议和标准,当然作为末端来说,CEA还有HDR,VHD都在相关的端口方面支持像家里用的最多的2.0A,2.0B这个标准全部支持UHD,4K以及HDR,相关的认证标准也有了。说白了HDR最核心的情况,我们从看到的日光,最后我们看到实际上日光的自然光线下的场景,最后变到终端显示器下的场景,这两块场景的变换,显然不能是一一对应的,这块存在非线型的变换,这块的变换是我们整个电视传输体系,包括电影传输体系最基本的道理,所谓的OOTF,这块的变化,我们真正看到的场景,和真正末端显示的这块,有一条飞线型的线来做变换,恰恰为了实现这条变换,我们实际上分别定义了摄像机这一端,光到电还有终端显示器这边的电到光,分别说的OETF和EOTF,这三者当中知道任意两条曲线,就能够到处第三条曲线,这实际上就是我们做整个电视从端到端进行光电变换的过程当中完成很重要的一个目的。
在2100标准当中,定义了两条曲线,我们看到第一条就是所谓的基于感知的量化曲线,这条曲线是一个定义我们亮度的绝对值从最低的亮度一直达到了一万级的亮度,在这个标准当中定义了PQ整个实现的场景,通过前端的OETF,这实际上是有两条曲线进行兑现的,一个是OOTF,还有EOTF的曲线兑现前端的OETF,末端的时候通过EOTF进行转换。当然还有一条曲线,实际上是HLG混合的对数伽马,这条曲线对应了前端的OETF,按照相对值进行对应,实现的同样在末端换成EOTF。中国怎么办?按照去年的年底工信部和广电总局已经成立了HDR,以及3DAudio标准专项组,专门制定中国HDR的下一步的技术标准,我们在这里面基本工作组工作了一年,首先定了一个需求,在这个里头考虑一下,我们的UHD4K面向HDR里头,面向大尺寸的家庭显示终端,在这个里头姑且不包括手机平板小的移动终端,首先面向大屏通常来说50寸以上来考虑。第二个我们HDR整个过程按照刚才的介绍,实际上包括采集制作播出接收到最后显示整个端到端的解决方案,所以这个方案一定是从最初端就要考虑进去,到最后末端。第三个还要考虑我们现有广播电视已经有的,有线电视,卫星传送,还有地面广播,还有现在IPTV,还有OTT的环节。
我们这次姑且先不考虑蓝光的存储,因为在美国实际上蓝光是一个很重要的,也定义了相关的HDR的标准,在这次中国标准先不考虑蓝光介质。我们结合了国内现在的平板显示的情况,我们定义了SDR的显示设备,按照100以下定义SDR,现在和工信部结合起来,已经有相当多的电视机接受300亮度以外的,我说的这SDR的显示设备,和高清标清没有关系,仍然是支持4K的显示屏,只不过支持不了那么高的亮度而已,这块我们定的是300以下,HDR的显示设备我们参照了相关的方法,但是我没有按照他们选的标准,我们只定了一个范围,在LED背光显示里头定义了0.01到2000,这块的显示范围我们能够拿到的范围,通常来说落到的指标可能不会到2000,可能会落到1000,或者到1500这个水平上,我们定义的标准0.05到1000nits,他们那边定义是540nits,到0.005的范围。向低端靠和向高端靠我们有两倍的形成,只要是达到在这个范围内,你至少应该满足的就是十万比一的对比图要求。
从制作场景,我们也要既考虑信号的电视直播,同时考虑后期的制作,而在输出格式上,我们现在还要保证在输出格式上,输出的上面可能还会包括关键的,你是直接HDR,还是过度期传SDR,在传输的体系当中既要包括信号。分发模式上刚才已经说到了,基于这么多种分发,我们的编码格式按照国家的规定,马上采用AVS2,这个性能经过测试达到现在HEVC的编码效率,这部分的标准正在走国标的标准,相关的芯片应该在六月份出。传输层10比特同时给出选数据的上线。在末端显示这块,我们要考虑中端既要支持高动态显示的要求。家里买了某一家的设备,可能不在两千,可能在一千五,那来的信号要根据自己的显示反映做试配。我们参照国际上的考量,初步规划了两个阶段,第一个阶段我们假定条件,市场上现在生产的主流的4K显示器设备仅支持SDR,现在国内生产只支持SDR的设备应该是在四五百万量级,明年一年还会有一千多万量级的量在推出。而在这种情况下,这部分的4K的电视机上不能支持SDR的时候应该怎么办,我们作为阶段一,而阶段一的核心就是在传输环节当中,实际上是传的SDR的信号,而到末端的时候,根据传递下来的Metadata。只有少量旧的设备,若干年之后只支持SDR的设备,这些设备为了正确显示应该怎么办,这时候传输缓解送的信号就是HDR的信号,这时候到了家庭终端,对于正常的HDR的显示器直接显示,对于我过去老的电视机,SDR的电视机就需要一个机顶盒把光亮降到他能够显示的范围供他显示,这是阶段一,阶段二。
实际上这两种情况,国际上也是这么走,也是分成第一阶段和第二阶段走,但是实际上对中国来说,我们实际上还有专门的考量,这里首先情况是,应该从国外情况来说,HEVC从2014年2015年推向市场,如果HDR的标准到今年年底或者明年才出来的话,在市场上至少有三年的市场期是大量的设备4K的电视机只是支持SDR,有这样的情况。但是对于中国来说,因为我们现在4K并没有播出,而且也事实上按照中国政府要求,我们必须采用AVS2,明年才开始有终端芯片提供,这样实际上这个时间点和我们HDR推进的市场是同步的,未必非要有第一阶段这个过程,这是第一种情况。第二种情况,现在市场上除了有300以下我们作为SDR去显示,还有另外一部分介于1000nits以下,中间商也够不着下也不配,又不能正确显示的问题,我们国家传输标准主要有限前端,都是基于DVBC,通常的传输马力38兆,从现在来看如果达到4K的标准,我们建议中间值是36兆,可以向下30兆或者向上42兆浮动一个25%-20%的空间,作为我们广播机的质量标准,现在当然业界都说,我们拿AEVC拿十几兆就行,但是我认为这个质量不是真正的4K的质量,如果达到这样,这是一个因素,我们以36为准是一个因素,如果HDR比SDR内容我们看到两个大冰块里头的信息量多的多,现在的信息量从现在的资料显示,至少增加20%的信息量,这样的话实际上在一个传输通道里头,上线的传输36兆,我们用EVS2不敢支持36兆,支持30兆加20%才能达到36兆,这样实际上这块还有一个拦截,所以说在这块三个情况,都是我们如何来考虑第一阶段,还是第二阶段,还是直接进入第二阶段,这个问题也是我们下一步正在评估的。
相关的标准,这块的工作已经由方案的征集进入到评估阶段,我们希望在明年的一季度拿出标准的草案来。以上是HDR的情况,第二个想介绍一下3DAudio发展历程,3DAudio实际上是从2000年以后陆续有一些国际上的厂家开始提出,如果我们把3DAudio概念非常简单,如果说是单升道一个点,双声道拉成一个线,环绕声在这个面上形成一个面,3D是形成一个扩容,真正产生三维的声音,使我们的听音者进入到沉浸式的临场感觉,在这块各个厂家实际上已经都在这个里头做了相关的技术尝试,不管是欧洲是美国还是日本,都在这个里头做了大量的工作,相关ITO的标准在制作端已经形成。
ATSC3.0包括3DAudio相关的标准,DVB在蓝皮书里头包括了3DAudio标准,韩国已经做了相关的技术的测试。在2020年东京奥运会推广8K的节目。我们3DAudio我们也是要考虑广播的典型场景,以及我们现在有网络的分发场景,面向家庭终端既包括家里的扬声器组,也要包括人耳通过戴耳机听到的效果,我们在这方面的技术需求都是在制作模式上。家庭后端也要摆出5.1的环境进行制作,现在的技术提供了所谓的基于对象的,在这个音响当中我可以拟定某一个对象,单独听最简单来说,或者就想听乐队当中小提琴的声,都可以单独把别的声挡下来,单独听,这都是可以兑现的。当然国际上还有下一代的技术,就是所谓基于场景的HOA相关技术,这次的标准里头只考虑ChannelBased、ObjectBased,家里的环境提到的5.1.4,还有7.1+4,我们支持在传输通道里头至少支持四个对象,当然了这些东西原数据应该是能够通过传输途径船到末端,实时末端每个听音者,来调整对象,或者是调整自己专有听音的环境和条件。我们传输通道按照不少于六个传送通道,Metadata也是这样,按照现在的广播速率作为标准,如果今后需要更高的质量,更多的通道我们可以变成768,对网络分发的码率,建议在384到两兆以下。在听音环境上,实际上现在假定是按照5.1.4进行音响的配置,末端的渲染环节应该能够支持5.1.4,当然有的加这样的声下去以后,终端用户可以调整Object,在移动终端现在越来越多的年轻人听高端的音乐,听沉浸式的音响,他们不可能在家里听,这样的情况下,基于现有的耳机,经过耳机一些渲染的算法,可以根据曲线效应生成一个声音,听音者能够感受到你在头整个前后左右上下,都能够感觉一个声音包围着你,这个实际上现在也完全可以做到,这是我们下一步很重要的方向。

相关的标准也已经同步起动了,这部分的工作征集方案全部过了,我们从一月份进行方案的评估,这个应该是不晚于明年的二季度,我们提交方案的草案。基本的情况我想跟大家上述这么多,实际上HDR和3DAudio是UHD非常重要的内容,不单单把清晰度提高给你看到的效果,更多的是让你增加了更亮的亮度细节和暗部细节,让你产生了沉浸式临场的感觉,这块的发展实际上会大大的带动末端消费电子的整个行业的发展。第二个因为标准我们会按照AVS2会按照明年上半年的条件做,这是中国政府坚持在这块起步前进的,这个标准的发布将会大大促进中国的UHD的发展。第三个实际上就是,尽管UHD已经来了,实际上对中国的现状来说,它不是像高清式来了以后替代了原来的标清,UHD会和现在的高清是一个长期五年十年并存的阶段,我们广电界会利用这个机遇,整体的促进UHD业务的发展,我的报告就到这,谢谢各位。