在开始出现视频压缩的二十多年以来,一直要求压缩效率、CPU利用率和体验质量的提高。
然而,哈雷公司编码器高级产品经理Jean-Louis Diascorn表示,一种利用人工智能来改进压缩算法的新方法已经出现,并且已经产生了效益,影响地面电视广播公司、OTT服务提供商、IPTV服务以及卫星和有线电视运营商。

在10月21日举行的2019年度SMPTE技术研讨会和展览会的第一天,Diascorn讨论了哈雷如何利用AI获得这些改进。
在他的“AI技术如何显著改善广播和OTT内容分发的视频压缩”演讲中,Diascorn描述了利用AI优化压缩方式的两步法以及优化帧率和分辨率编码的注意事项。
他说,第一步是线下学习过程,这可能需要几个小时甚至几天的时间。在这个阶段,许多测试盘被输入AI系统,生成一个预测模型,然后下载到实时编码系统中。
第二步是运行实时系统,它将使用预测模型,为观看产生更好的压缩。
他提出了三种预测模型:动态编码方式,动态分辨率编码和动态帧率编码。
动态编码方式旨在降低比特率和保持质量。使用两步法,测试文件被加载到AI系统中,开发这些编码方式。“编码方式实际上是编码配置,”他说。
Diascorn解释说,在文件上运行了很长时间的AI算法后,系统产生了一个编码方式预测模型,它被下载到实时系统中。在实时系统上运行时,视频分析为预测模型提供信息,而预测模型反过来修改编码核心。
Diascorn说,某一级卫星提供商已经部署了动态编码方式优化的压缩,并实现了约20%的比特率降低。
动态分辨率编码依赖相同的两步法,但在这种情况下,AI在开发预测模型时利用了运动和分辨率之间的关系。
Diascorn解释说,在低运动视频中,人眼可以看到细节;然而,在高运动视频中,比如在体育运动中,人眼无法识别相同的细节水平。“因此,找到合适的解决方案是有益的,这就是动态分辨率编码所做的,用AI为某一视频选择可能的最佳分辨率。”
他说,动态分辨率编码主要用于OTT服务,得到的好处主要是节省了CPU,“对于复杂内容,我们发现节省了50%的CPU使用率,对于简单内容,我们发现节省了42%的CPU使用率。”
动态帧速率编码“有点像前面的编码,只是采用了其它方式而已,”Diascorn解释说。在有大量运动的视频片段中,希望有高帧率,以避免图像中的任何抖动。相反,在几乎没有动作的视频中,“为什么要用尽比特?”他问道。
动态帧率编码再次使用了两步法。这一次,这个过程被调整为对视频内的运动量创建一个基于最佳帧率的预测模型。
动态帧率编码适用于卫星、IPTV、OTT、有线和地面电视广播,平均节省约30%的帧量,相当于节省CPU使用率约30%。“在比特率节省方面,AVC大约是10%,HEVC大约是5%。”
Diascorn指出,取决于应用场景,可以把AI优化的预测编码模型结合起来。
他说:“动态编码方式和动态帧率编码都提供了比特率的节省——对动态编码方式来说是非常重要的节省,而动态分辨率编码带来了更好的体验质量。”
“DRE(动态分辨率编码)和DFE(动态帧率编码)带来了CPU的节省,在互操作性方面,动态编码方式和动态帧率适用于所有应用,而动态分辨率编码主要适用于HD OTT。”
Diascorn指出,用AI增强压缩技术的性能还处于早期阶段。他说:“我们有一个令人兴奋的未来,因为我们才刚刚开始。”