视频会议进入IP时代
使用电脑、移动电子设备,甚至QQ或Skype这些聊天工具,只要你愿意随时都可以连接召开视频会议。在视频会议如此普及的今天,我们很难想象到开个视频会议要需要专门建立企业专网,系统之间的互联互通在十多年前更是一种奢望。
在ITU-T(国际电信联盟)发布了用于局域网上的视频会议标准协议H.323以后,与Internet和Intranet相连的视频会议系统拥有了互通的标准,各厂商纷纷推出符合该标准的产品,基于IP的视频会议技术的应用逐渐发展起来。视频会议开始由专网进入IP宽带网络时代。尽管MPEG-2以其先进性为整个行业带了实质性的变化,网络的丢包率大大降低,但在IP网络环境中实现视频会议,对QoS保证、网络安全、系统优化等也提出了更高的要求。尽管低丢包率对VoIP以及数据传输应用不会造成明显的影响,但对视频会议来讲,出现严重的图像质量损坏却是很难接受的。为了应对这一问题,业界采用了基于向前纠错技术(FEC)的丢包隐藏技术。但FEC要求增加流媒体的比特率,也就对带宽提出了更高的要求。
经过过去几年技术、网络的发展,视频会议告别了网络带宽限制、图像质量不够流畅、高昂的价格成本这几个多年前长期制约视频通信走向普通企业应用的阶段,已经日益成为企业日常工作不可或缺的一部分。
但视频会议系统仍然存在着诸多限制因素。作为最终用户的企业,为了能够实现无时无刻的视频通信,他们不仅需要承担视频会议系统本身较高的成本,还要为会议室、网络设备这些辅助的隐性成本买单。即便如此,用户依然不得不承受图像丢帧、网络延迟、马赛克等问题的困扰。价廉物美的视频会议系统似乎还是遥遥无期。
AVC面临的问题
H.264AVC标准公布之后,迅速被主流视频会议厂商在编解码器中广泛采用。会议厂商也逐渐开始在自己的编解码器中采用该技术。作为一种新的国际标准,H.264标志着在视频编码技术上的不断进步,它在编码效率、图像质量、网络亲和性和抗误码方面都取得了成功,点燃了人们对丢包和网络延迟这些问题的技术解决方案渴望的热情。
随着终端和网络的快速发展,对视频编解码的新要求在不断出现,如何进一步优化算法结构、降低处理时延、提高实时性和进一步提高图像质量这些问题一直都是人们关注的焦点。采用传统编解码技术的视频会议常出现三个问题:网络并不总能提供高质视频效果,总是频繁出现丢包和抖动,导致视频效果不流畅、清晰; 网络不能为所有用户提供持续的可用带宽;由于MCU对连接带宽和CPU资源的需求比较高,因此,对当前所用的多点会议单元(MCU和桥)分层较为困难,而且成本相当高。
SVC带来的飞跃
当这些问题亟待解决时,SVC(Scalable Video Coding可分层视频编解码)标准的问世为业界带来了更多的希望。SVC是对规定设备如何对多层视频流进行编码和解码的H.264视频协议的扩展,被称为H.264-SVC,使用H.264-SVC的设备可提高相互通信时的误码弹性。我们来比较下非分层编解码器与SVC之间的不同所在。
非分层的编解码器通常以连接建立的带宽大小为基准,在给出的可用带宽下自动分配分辨率和帧频,以获得最佳的编码效果。这就意味着,如果可提供的网络带宽越大,经过编解码器处理后的高清晰移动图像的质量也就越高。如果带宽非常高,并且足以提供每秒30帧、甚至60帧的全高清视频,那么这时就不会有任何的取舍问题。
但我们通常所面临的问题是现实的带宽并不能达到足以提供每秒30甚至60帧那么高视频质量,在这种情况下,编解码器就要在分辨率的优化和帧频的优化间有所偏重,而这个结果主要取决于视频中移动图像的数量和编解码器的设置。现在的大部分编解码器还包含动态带宽算法,在网络发生数据包丢失时,这种算法的主要目的是以减少带宽的使用量为途径实现画面质量的流畅传输。动态带宽算法的原理是先假定发生了数据包的丢失,也就是说网络已经出现了拥堵,而降低带宽就能缓解拥堵,这样就能获得一个更好的连接。
可分层视频编解码(SVC)是对H.264视频编解码标准的扩展,SVC技术允许视频会议设备收发多层视频流,包括小规模的基础层以及可选的附加层,以便提高视频分辨率、帧传输速度和质量。分层技术能够大幅度提高网络弹性和视频质量,但不会耗用大量带宽。此外,一个多层SVC视频流可以支持多个设备和网络。
SVC之所以特别,在于其工作原理就与传统编解码器的不同。SVC对传输在IP网络上的一系列视频帧采取了一种特有的打包方式。它利用多个不同的流对视频图像进行压缩,每个流处理高质视频图像的不同组成部分。第一个视频流用最低的带宽来处理清晰度低的图像,附加流则对包含更高分辨率、帧频和质量水平的信息进行编码,以获得更高清晰度和更优质的移动图像。不过这些附加流并不是对第一个流中包含信息的重复,而是对它的补充。
与MCU的冲突
SVC技术的拥护者可能认为,使用了该技术之后就无需MCU了,因为SVC现在所做的工作与MCU编解码器一样。这就需要我们更加深入的分析,传统的H.264AVC多点视频呼叫中,汇集到MCU的视频信号来自于各个终端,通过把信号转换成适当的文件后传回到显示屏。假设,有4个与会者参与会议,他们使用了3种不同的设备,包括2台会议室系统、1台PC和1台移动设备。输入信号源需要进行编码成为3种不同的输出信号,这个过程就对电脑响应提出了要求,而且可能产生较为明显的延迟。
如果终端采用了SVC编解码技术情形就完全不一样了。MCU确实能把一个终端的高清图像的代码转换成可用于另一个端点的标清图像。不过要具备这个能力,MCU需要具备强大的专业的信号处理器。而在SVC环境中的CPU仅需确定SVC流的哪些部分需要发送,哪些不需要就可以了。如果一个端点只要基层信息,那么也就只要把基层的流发送出去;而如果端点要求原清晰度的图像,那么就要把所有的流都发送出去;而如果端点对清晰度的要求居中,则需要发送这些SVC流的部分组合。由于这种操作比用一个计算点的方式更方便,所以SVC桥会便宜得多,并且能够处理更多同步的端点。
SVC先行者
早在2005年,MPEG和ITU-T的VCEG联合将SVC的扩展集草案提交给联合视频组(JVT)讨论,联合视频组(JVT)将此标准定为H.264-SVC标准。此后,每次JVT的会议都围绕着SVC技术对标准进行修订和完善。其发布后受到了许多厂商的响应和推崇。
Vidyo公司首当其冲,不仅帮助委员会起草了SVC标准,还向其他业界厂商展示了其先进性,让更多的人参与了进来。之后,宝利通宣布开发基于标准的H.264 SVC技术的UC产品, SVC免费提供给战略合作伙伴,用于通过“统一通信互操作性论坛”(UCIF)这样的行业组织,向开放和互操作性通信标准提供支持。在宝利通推出SVC技术产品后,微软是最早宣布采用宝利通H.264 SVC技术的公司之一。
RADVISION认为SVC是一种演进,正在为其基础架构和桌面产品引入可分层视频编解码支持。H.264-SVC对于视频编码来说是一大进步,就像从H.263到H.264的进步一样。并表示将发布桌面到桌面的会议系统,该系统使用SVC来实现桌面和会议室组合解决方案。
惠普在这项新的技术方面也很快有了动作,发布一系列基于Vidyo技术的视频系统产品,从2011年开始与Vidyo更加紧密合作,共同开创基于互联网上的高清视频通信系统的新纪元。
期待
SVC技术的广泛应用至少有两点值得期待。首先,终端产品将更加倾向于采用AVC和SVC两种编解码器。在视频呼叫发起时,终端系统会自动优化选择使用什么编解码器,而选择最终可能取决于网络连接的类型或者其他终端的功能。第二,SVC保证了更高效和灵活的会议内容存储,支持高清和标清的存储方式(通常的会议录制标清甚至更低的分辨率已足够),同样,SVC技术的优越性也可以在监控应用和录制中得以更广泛的体现。