在过去十年中,以太网和Wi-Fi已成为最重要的网络技术,通过RJ45插孔或Wi-Fi将电脑、手机等终端设备接入以太网已经成为家常便饭。随着时代的进步,这两种技术在速度方面不断突飞猛进,如今最先进的以太网已经演化到100Gb/s。与此同时,AV设备在这十余年间也得到大规模部署,而AV与IT融合的深入,让AV成为了重要的网络设备组成。虽然AV系统利用IT基础设施进行传输、控制、管理的好处显而易见,但由于IT本身并非专为专业AV而建立,因此也难以满足专业级的严苛要求。融合过程中,很多问题随之而来,例如高昂的每节点成本和令人望而生畏的部署网络AV系统的专业技术要求。这就是为什么联网的音视频在过去并未如我们所期望的那样得以广泛应用。为了解决这些问题,IEEE 802.1 AVB工作组正致力于制定和推广一系列的新标准,通过对现有的以太网进行功能扩展,建立高质量、低延迟、时间同步的音视频以太网络。
融合的困境
过去AV设备之间的连接是模拟单目标点对点单向连接,即使当AV流媒体传输进入了数字化时代也经常会重新用到点对点的单向连接结构。这些年来,音频连接从模拟演化为I2S或SPDIF/AES;专业视频从模拟时代的RS-170A到标志数字制作开始的SDI,再到今天的HD-SDI;而消费视频也经历了从模拟复合到模拟分量再到HDMI的转变。这其中有些仍然需要预留点对点单向连接,因为当这些特殊连接首次部署的时候,使用本地局域网络成本高且无法保障可靠性。(例如,当I2S/SPDIF连接首次用于音频系统中时,即使单个I2S流都无法被10Mb/s CSMA/CD以太网可靠传输。) 但是这种专用的点对点的连接模式,在不论专业还是高端消费类应用中都会导致一堆庞杂线缆的头疼问题。
因此,业界也针对这些问题进行了若干尝试,包括:
1、专门针对专业AV的技术,例如IEEE1394/火线。
2、针对家庭影院的多种非标准无线数字音频传输分配系统。
3、标准IT类型演变而来的网络,例如CobraNet。
由于针对专业、家庭和汽车使用的专用A/V技术太过专业化,因而不能与像以太网这样的常规IT网络进行轻松的互操作。而视频摄像机或者专业音频设备这些需要特殊服务保障的应用,其市场也会受到限制。
而标准IT网络在演进过程中同样面临着一些问题:它们最初是为日常设备建立的网络,但是在专业的应用当中,要得到专业级的服务就需要对如何使用和管理设备进行严格的控制。所谓专业级服务意味着非常低的、确定的时延,无丢包,能够实现流媒体的终端播放同步。
其中,A/V流媒体对网络的要求,包括:
1、首先要能够实现多个流媒体的同步。最简单的情况就是保证“唇同步”,这样电影或电视里的音频和视频就不会出现声音和口型不一致。更加严格的要求包括保持多个数字扬声器的同步相位,在专业环境中,这意味着保持媒体流的几乎1微秒内的同步。
2、网络中一路媒体流在最差状况下的时延,包括信号源和终点的缓冲时延,必须是低且确定的。对于几乎所有的消费类应用来说,这意味着网络必须没有显著造成用户界面的延迟:这个时间是从用户请求一个动作(例如按下控制器的按钮)直到动作被用户轻易感知到(例如“播放”、“停止”、“前进”、“倒退”),这大约需要50毫秒响应。而现场演出、录音室或游戏应用对此要求更加严格,大约为2毫秒。
3、最后,应用必须达到高度的置信度,这样才能保证有所需要的网络资源可用,并且只要有应用需要就可保持可用性。这种情况有时被称为“预留”,有时又被称为“进入控制”。其目的是在应用中提前通知网络某一路媒体流的需要,并让网络锁定那个媒体流所需要的资源,如果是不可用的,便通知应用方。AV媒体流所需的典型资源包括吞吐量和具体的时延范围。
目前几乎所有网络设备都是基于IT要求的:在整个网络上尽可能快地移动数据,以及最低的成本和最少的管理。
只要没有对于时延和同步的硬性限制,这是一个很好的方式。面向IT的网络并不总是能够满足上述的要求,因为:
1、在一般的IT网络中没有“时间”的概念,其网络架构本身并不提供有助同步或任何精确时间的机制。
2、时延可能太高——通过一个网络的平均时延水平可能不高,但是几乎不会对限制时延有所帮助。在IT网络中,可靠地传输数据远比在规定时间内传输数据显得更为重要。
3、网络本身并不能预防网络堵塞,所以如果缓冲不足或没有足够的链路带宽用于流量,数据就可能丢失。IT网络依赖更高层的协议通过传输节流和重新发送丢包来处理堵塞(例如TCP)。这种方式适合于可接受长时间时延的情况,但是在要求低确定性时延的地方则不适用。
解决最后两个问题的典型方式是缓冲,但是过多的缓冲会导致时延,这会成为消费级环境的困扰,而在专业领域更是不可接受。另一个方式是让现在面向IT的网络在用于AV媒体流时,在更高的层管理网络或实施严格的界定和固定的配置。例如,在专业市场,很少有系统可以提供适当的时延和带宽保证,但是他们可以提供一个单一的专用解决方案, CobraNet就是这种架构的一个例子。
技术概览
AVB技术最初源于一个802.3的研究小组,在2005年11月正式成立了IEEE 802.1AVB工作组(Audio/Video Bridging Task Group),开始着手研究制定一系列的协议,以增强现有802网络的功能。AVnu联盟是一个行业论坛,致力于在各网络链路层推行采纳IEEE 802.1音频视频桥接技术和相关标准,以经济的成本实现具有专业品质的音频视频传输,并联合其他组织和企业在各自的尝试中利用这一技术。
目前有来自两个阵营的力量在推动着以太网AVB的发展,一方面是系统产品厂商,致力于提供一套基于标准的方案来为演播室、影剧院、音乐会现场及汽车娱乐系统等提供稳定可靠的音视频服务;另一方面是芯片厂商,希望提供低延时、供家庭及企业使用的同步音视频网络。
AVB于2009年7月颁布草案,并在2010年和2011年陆续完成,以下为它的四个基础标准:
IEEE 802.1AS(PTP):“针对桥接局域网上的时间敏感应用的时序和同步”。自动选择一个设备作为主时钟,然后通过桥接的LAN/IP子网分配时间到所有其他节点。802.1AS时钟不能用作媒体时钟。相反,802.1AS时间可被用做节点间共享的时钟参照,用作从讲话者到听众的媒体时钟端口。有了这样的参照,当估算在大量网络抖动的情况下发射器的实际媒体速率时,就无需确定数据包发送的时延或者计算连续运行的平均值。IEEE802.1AS是基于获批的IEEE1588-2008标准。
IEEE 802.1Qat (SRP):“虚拟桥接局域网——修正案9:媒体流预留协议(SRP)”,允许在桥接的LAN/IP子网上的讲话者与听众之间建立媒体流预留。传统IEEE802网络标准的特性限制了其无法将普通异步流量与时间敏感的流媒体流量进行优先级划分。为了提供有保障的服务质量(QoS),SRP确保了AV媒体流设备间端到端的带宽可用性。如果所需的路径带宽可用,整个路径上的所有设备(包括切换器和终端设备)将会对此资源进行锁定。
IEEE 802.1Qav (Qav):“虚拟桥接局域网——修正案11:时间敏感的媒体流的转发和排队。描述了一种整形网络流量的令牌桶算法①,让预留了时延和带宽的流媒体可以被控制,确保了传统的异步以太网数据流量不会干扰到AVB的实时音视频流。
IEEE802.1BA:“音频/视频桥接(AVB)系统”,这同样是基于IEEE 802.1AVB草案的标准,提供专业质量的音视频。
另外还有两个建立于多种网络链路层上的相关标准:
IEEE 1722(AVBTP):“时间敏感媒体流的第二层传输协议”,可实现目前使用IEEE 1394(火线)到AVB应用的转移。定义了局域网内提供实时音视频流服务所需的二层包格式,AV流的建立、控制及关闭协议。
IEEE 1733(RTP):“实时传输协议”,扩展的RTCP,使AVB可以支持网络上的RTP流媒体。RTP是一种目前应用最广泛的实时流媒体协议,与IEEE 802.1 AVB那样完全基于二层的标准不同,RTP是一种基于三层UDP/IP网络的协议。为了在基于IP的三层应用上利用二层AVB的性能,IEEE 1733对RTP进行了扩展,在通过桥接及路由的局域网内提供时间同步、延迟保障和带宽预留的服务,以提供实时音视频流的传输。[page]
优势和特点
AVB标准为基于802的网络提供了3个增强技术,包括:精确的时间支持低抖动的媒体时钟和准确的多流同步;简单的预留协议让终端设备上的应用方可以通知同一路径上的多种网络参与方,让它们预留必要的资源支持;排队和转发规则确保一个媒体流可以在预留协议规定的延迟范围内通过网络。这些增强的技术要求更高层的应用来形成这种功能,同时要求对连接技术进行改变(这在以太网中几乎没有),以及兼容标准802.1桥接的其他功能。这样,就可以摒弃过去那些需要费力调节的专业AV解决方案和精确调节的IT级别网络设备,以支持基于标准的方式。
同步
通过IEEE802.1 AS精确时间协议(IEEE 802.1 AS Precision Time Protocol,简称PTP),所有的AVB设备都可以根据一个共同的时基参考实现同步。802.1 AS协议定义了时钟控制选择算法,连接时延和连网排队测量及补偿,以及时钟速率匹配和调整机制。利用802.1 AS,媒体流将包括一个描述(presentation)时间。通过将媒体流数据包中的描述时间信息与802.1 AS的共同时基进行对比,所有网络中的设备就可以排列和调整它们的回放。这种方式的好处之一是,媒体流带有802.1 AS和描述时间封包,同时AVB网络内部支持多种同步采样率和采样时钟源,这样便能够实现视频和音频流同步,即使它们以不同采样率在不同路径上通过。利用描述时间的第二个好处是,如果有两个设备输出同样的媒体流,即使它们与源端的网络距离不尽相同,也可以在回放中被精确锁定。
无基础架构配置的可靠性
专业AV网络需要无音频瑕疵(如爆裂声或咔嗒声)、视频丢帧或其他问题的可靠的传输。目前被用在大型专业系统中的利基②解决方案要求网络具有多重的虚拟局域网(VLAN),以及手动调节的拓扑结构和参数。IEEE 802.1Qat媒体流预留协议(Stream Reservation Protocol,SRP)提供预留媒体流带宽的机制,允许终端应用配置路由,因而无需这种基础架构网络的搭建。在AV媒体流输出之前,SRP就会检查端对端带宽的可用性。如果带宽可用,整个路径就会处于“封闭”状态,直到有明确的解除信息。SRP与IEEE802.1Qav排队和转发协议(Queuing and Forwarding Protocol,Qav)密切合作,Qav可以安排时间敏感的AV流媒体数据,确保它及时通过网络。常规的非流媒体通信不能干扰预留的AVB通信。利用这种AVB协议,智能化的设备可以与网络沟通,提供可靠的AV媒体流,无需安装商或集成商进行大量的手动网络调节。
低延迟
SRP和Qav协议一起确保了以端到端的方式及时发送所有预留的媒体流。如果没有这些协议,就无法知道有多少非媒体流介入其中,或者有多少媒体数据包在排队等候。此前,由于在接收媒体包时的不确定性,专有系统的设计师会在终端节点内设置大量缓冲。而在有线以太网络上采用了AVB后,遍及整个网络的最恶劣状态下的通信时间是已知的。所以,只需要少量的缓冲并可实现非常低的延迟,如果是在一个100Mb/s的以太网上,七个转换跳的时间为2毫秒。
网络上的现场声
通过网络控制放大器或者有源扬声器是司空见惯的,因此大家自然而然也希望同样使用以太网用于信号传输。有了AVB,就可以轻松在音频流媒体加入控制信号,而不用要求用户变成IT专家。这种由SRP提供的高可靠传输使得AVB网络像模拟系统一样简单,将一个信号从一台设备随时路由到另一台设备而不必担心故障发生。使用如今的千兆位以太网,AVB网络的延迟几乎感知不到。这种AVB网络上的两个数字产品间的最小可能的延迟,要比同样两个产品采用要产生D/A和A/D转换的模拟连接的延迟更低。
多个供应商
今天很多小型的微控制器和DSP都是具有以太网性能的。只要做一些小的改变,这些芯片就可以轻松支持AVB。设计这些设备的成本可以被分摊到很多不同的市场,而不仅仅是专业市场的利基②部分。在过去,公司的专有解决方案一般很难提供充足资金用于其下一代芯片的开发。而由于这一技术的广泛的适用性,专业A/V市场将有望开辟更大的市场。一些芯片公司已经宣布计划支持AVB,预计还有更多的会很快跟进。
应用环境
在录制室使用以太网是非常普遍的,无论是小型家庭工作室或者大型广电级应用。如果未来计算机带有AVB性能的端口,家庭录音录像发烧友就可拥有简单且负担得起的高带宽录制界面。在专业市场,需要路由和切换非压缩HD视频的大型广电设备用户会发现其需要的基础设施会大大减少,因为AVB网络可以代替昂贵的、专门建造的中央HD视频路由器。除了AVB 10G和100G的网络性能外,最大型的广电设备用户还可以利用现代IT网络享受联网的HD视频传输和矩阵。
那些正在建设专有解决方案,或因成本和复杂性而很少部署网络音视频系统的集成商和顾问公司,会发现AVB能够满足其需求。它具备要求最苛刻系统所需的所有性能,以及简单的网络管理。在AVB网络中,可以添加不同价格点和不同性能水平的专业音视频产品。
由于AVB是由IEEE标准团体开发的,因此会受益于不断增长的速度和其他选项和功能。例如,HD视频可以不经压缩轻松通过10G以太网连接,这在今天可以通过铜线或光纤长距传输。更高层的功能如安全和网络管理,可以不必设计定制的解决方案。
现状与未来
截至今年4月7日,IEEE已经发布和批准的AVB标准包括802.1Qat、802.1Qav,以及802.1AS、1722和1733标准。AVB工作组主席Michael Johas Teener表示:核心的AVB标准已经完备,我们可以加速推进在专业市场采用AVB的事宜和互操作项目。另外,刚刚公布的802.1AS能够实现以太网上设备之间百万分之一秒内的同步,而802.11v则能够使802.1AS扩展到无线局域网的应用中。
目前,在AVB的基础推广者中包括了博通、思科、哈曼、英特尔等行业巨头,在推广者中也不乏博世、巴可、声海、舒尔、百威、德州仪器、雅马哈、Biamp、Avid、ClearOne等专业AV领域领军企业。在今年6月举行的美国InfoComm展中,已经有很多厂商在现场展示了采用AVB标准的产品。
Meyer Sound的D-Mitri是一个基于千兆位网络的数字音频处理和传输平台,具有高清晰度音频,真正的实时网络环境,采用IEEE802.1AVB。D-Mitri提供整体的多声道音频环境,在一个全网络的架构下结合了所有I/O、信号处理、矩阵混音、路由和扬声器管理,并可以满足无数特殊应用需求。D-Mitri架构的核心,结合了AVB性能,这样便可以轻松创建一个分布式的D-Mitri系统以及远程控制的麦克风前置放大器和其他设备。而且无需专有音频网络和不必要的布线。设计满足了实时流媒体需求,并保证了服务质量(QoS)和低延迟,低抖动主时钟保障可靠的时钟和同步。充足的原始带宽支持高通道数通过每个AVB端口。

Meyer Sound的D-Mitri数字音频处理和传输平台
BSS Audio的GS724T以太网切换器是一个24端口,支持以太网AVB网络的、全面管理的千兆位切换器。由于全面支持以太网AVB技术,GS724T允许音频、视频和数据在以太网AVB兼容设备之间分享,例如配备有SC以太网AVB高速选项卡的dbx产品。在全双工模式下,24个端口中的每一个都可以支持2,000Mb/s的数据吞吐量,输出总带宽达48Gb/s。GS724T针对每个端口提供10/100/1,000的自动速度检测、全/半双工检测以及Auto UplinkTM。在直观的网页浏览器界面上提供对性能监视、端口配置、VLAN流量控制、流量优先服务等级、流量过滤等的管理。

BSS Audio的GS724T以太网切换器
DSP4YOU提供一系列的AVB产品,其中Dana服务器利用现有的IT架构,使用可切换的以太网作为音频和控制数据的传输通道,从而带来更大的可扩展性以及简单性以节约成本。而Dana创新技术的核心在于基于最新AVB标准的模块开发。在以太网上多个非压缩和同步音频通道流媒体的能力,帮助Dana系列提供在IT友好平台上的优质的声音质量。
Biamp在InfoComm 2011上推出的网络媒体系统Tesira是一个使用AVB技术作为主要数字传输方式的、具有高度可扩展性的数字音频网络系统。该系统配备了模块化可扩展的输入和输出端,DSP和联网的终端,提供各种类型的系统设计能力,包括集中式、分布式和混合型应用。Biamp方面表示Tesira代表着下一代的设计,是网络媒体系统概念的进一步发展。
AVB是真正专为音视频网络设计的标准,能够解决制造商、集成商和终端用户在目前应用中遇到的各种问题。我们也期待在IT和AV融合的大时代,这项技术能为AV行业带来一个高质量、低延迟、易使用的专业级网络环境。
①:令牌桶算法是网络流量整形(Traffic Shaping)和速率限制(Rate Limiting)中最常使用的一种算法。典型情况下,令牌桶算法用来控制发送到网络上的数据的数目,并允许突发数据的发送。
②:利基(niche)是针对企业的优势细分出来的市场,这里指针对性、专业性很强的产品或解决方案。