微博

QQ

CobraNet与EtherSound音频传输技术比较

2014-12-22 信息化视听网


  以太网上传输音频信号是近几年来专业音频行业的一个技术焦点,也是日后专业工程项目中的一个重要的传输技术环节。因为它是不依赖于控制系统而独立存在的一个产品,可以广泛地应用到很多的不同项目中去,一方面解决了多线缆的布线困难问题,同时也解决了远距离传输、数据备份、自动冗余等一系列在模拟传输时代所无法面对的问题。目前比较成熟的以太网音频传输技术主要是 CobraNet 和 EtherSound 技术,前者已经开发和使用多年,用户较多,交互性好,缺点是网络延时长,后者解决了延时的问题,但是开发和使用普及程度稍差。两者在技术上各有千秋,本文之目的就是客观地分析两种网络的应用区别,以求证一种相对适合的应用方案建议给广大读者。

  1、网络特性综述

  a、CobraNet 网络:是美国 PeakAudio 公司开发的一种在以太网上传输专业非压缩音频信号的技术,它可以在100M以太网下单向可以传输64个48kHz、20bit 的音频信号通道(48kHz、24bit信号为56路);除音频信号外,还可以传输 RS485串口通信数据及其它非同步IP数据;开放的 MIB 文件,支持 SNMP。可以从 PeakAudio 公司获得相关技术资料,使用模块化的 CM-1可以方便地将音频信号转换为 CobraNet 信号,具有成型的软件工具包(SDK)和 API。

  b、EtherSound 网络:由法国 Digigram 公司开发的一种基于以太网传输音频信号的技术。传输能力为单方向64个24bit、48kHz(或44.1kHz)采样频率的音频通道。虽然它不能传递串口信号以及其它IP数据,但是它的技术最大的亮点就是极低的延时,因此 EtherSound 技术最适合应用到现场演出中去。

  2、硬件结构对比

  a、CobraNet 硬件设备

CobraNet与EtherSound音频传输技术比较

  CobraNet 硬件设备目前主要包括CM-1,CM-2两种。其中 CM-1为 PeakAudio 自己制造的成品通信卡,属于第一代产品,但是网络通信能力比较强,价格较高;CM-2可以定制生产,任何厂家只要从 PeakAudio 购买了主芯片,并获得了生产许可后就可以自行生产 CM-2板卡,并且可以集成到其它产品的主板上去。CM-1和 CM-2的主要区别如下:

CobraNet与EtherSound音频传输技术比较

  其中 CM-1使用的是 DSP56303+FPGA 以及其它存储器构成的芯片组。由于开发的比较早,所以 DSP 的速度受到了 DSP56303的速度限制只能达到24bit/100MIPS。而 CM-2则支持更快的32bit/100MIPS 的数据流。对于CM-2来说16个单方向通道是最大的极限了,如果生产8通道的产品相对成本比较低,但是16通道的就还需要增加 FPGA 桥接才能构成16×16的完整通道。至于 CS1810XX 和 CS4961XX 系列主要区别就是后者包含了一个基本的用户 DSP 可以使用,这大大的方便了某些用户,省去了开发 DSP 和 CobraNet 的接口的费用。至于CM-1可以传输特殊的9bit串口通信数据完全是为了适应一些特殊的设备(如 ControlMatrix)。

  还有一些 CobraNet 硬件设备所用之处不多,比如一些叫做 CM-1-FW 的模块,其实是由使用厂家向 PeakAudio 定制的特殊的CobraNet板卡。他们的功能和 CM-1相同,但是电路板上通常集成了使用方需要的其它 DSP、ADC/DAC 以及供电等功能。

  b、EtherSound 的硬件设备

CobraNet与EtherSound音频传输技术比较

  EtherSound 硬件的生产也和 CobraNet 类似,有些是版权公司生产的,比如上图的 OnAir 3000就是为瑞士 Studer 的数字化直播调音台定制的;还有一些是 OEM 合作生产的,比如 AuviTran 出品的 AVY16-ES 就是为 YAMAHA 乐器公司生产的 Mini-YGDAI 格式的 EtherSound 接口卡,这种网卡除了可以安装在 YAMAHA PM1D、 PM5D、M7CL 等系列数字调音台上外,还可以安装在 YAMAHA 出品的 DME24N/64N 数字 DSP 接口箱和 NEXO 网络系统等。

  经过几代的发展,目前 EtherSound 硬件产品主要产品按照接口能力的发展顺序分为 EtherSound、EtherSound100 和 EtherSound Giga,主要的技术指标区别如下:

CobraNet与EtherSound音频传输技术比较

  ES的模拟端口能力只有8通道和2通道两种。

  3、网络结构对比

  a 、CobraNet设备的网络结构

CobraNet与EtherSound音频传输技术比较

  CobraNet 必须使用星型(或连星型)网络结构,所有的 CobraNet 设备都必须通过以太网交换机互相连接在一起。这样的结构与标准的以太网设备是一致的。由于 CobraNet 采用了同步通信技术,所以其同步数据报必须在有限的时间误差内广播到所有节点,这主要取决于交换机的交换原理和通过数量,一般来说最远节点 CobraNet 设备之间的交换机数量不能超过6个(若存在 Spanning Tree,则按照树型结构的最远点计算)。一般来说使用 Cut-Through 类型交换机会减少同步延时。

  b、EtherSound设备的网络结构

CobraNet与EtherSound音频传输技术比较

    EtherSound 设备系统可以采用菊花链结构或以太网星型结构或者这两种结构的混合形式。当采用菊花链结构时,音频的传输可以单方向或者双方向,这取决于每个节点的硬件属性是否支持双向传输。唯一的问题是当 EtherSound 数据流通过以太网交换机的时候只能是沿着一个方向(Downstream)传递音频数据,也就是说无论这台交换机上连接了多少个 EtherSound 设备,同时只能有一台经过配置的设备可以向网络中发送音频数据,其它节点只能用来接收。这种数据包是广播类型的,但是由于每个端口是等带宽数据传输,所以只能使用全双工的交换机而不能使用 HUB。对于数据量比较小的非同步控制信号,则可以进行双向传输的。

  4、网络协议结构对比

  a、CobraNet数据报协议特征

CobraNet与EtherSound音频传输技术比较

    CobraNet 传输协议的构建依靠3种基本数据包来完成:一是同步数据包(Beat Packet),它是由网络中的 Conductor 发出的同步指令数据,每秒种750个,作为每个同步周期的起始数据包与网络中的全部 CM-1设备保持精准同步;二是同步音频数据包(Isochronous Data Packet),也是 CobraNet 需要传送的真正数据内容,可以单播(Unicast)也可以多播(Broadcast)出去;三是预约请求数据包(Reservation Packet),它是由除了 Conductor 以外的所有 CM-1发出的广播数据包,包含了发送请求数据和优先级等重要信息。除了以上三种必须的数据包类型外,还有两种可选的数据传送包:串口包桥(Serial Bridge)和 IP 数据包桥(Packet Bridge)。这两种数据包和 CobraNet 的音频数据传送本身没有任何关系,是一种附加的功能。也就是说我们可以通过 CobraNet 网络传送和音频无关的串口或 IP 格式的控制数据,这种数据桥功能在工程应用中起着非常重要的作用。CobraNet 数据量仅与传输的有效通道数有关。

  b、EtherSound数据报协议特征

CobraNet与EtherSound音频传输技术比较

  和 CobraNet 协议不同,EtherSound 数据包只有一种格式。同步和音频数据在一个数据包中存在了,换句话说就是一种自同步技术。EtherSound 同步方式借鉴了总线式同步数据传送方式,如火线 IEEE1394接口协议,数据包发送的频率就是同步频率。IEEE1394协议是一个点对点协议,所以同步数据是发送端确认,这一特征也被 EtherSound 所继承,同步发送的数据是从第一个设备中产生。可是对于一个菊花链/星型结构的网络系统,哪一个设备算是“第一个”呢?这个第一就是由用户在搭建系统的时候根据系统的配置自己设定的,并将其命名为“Primary Master”,也就是说一个完整的 EtherSound 系统只能有一个“Primary Master”,它的作用与 CobraNet 的 Conductor 作用类似,只是工作原理不同。如果系统同步时钟定义在44.1kHz 的话,那么“Primary Master”就按照44.1kHz 的速度向外发送固定长度为236字节的以太网结构数据包,如上图。总数据开销可以计算出=44100×236×8=83.3Mbit/s;同理可以计算出48kHz 采样下的数据开销为90.6Mbit/s,显然这已经到达了100M 以太网的实际传输数据上限。

CobraNet与EtherSound音频传输技术比较

  上图中左侧的 ES 设备就是“Primary Master”,它被控制电脑配置后开始向网络中发送标准的 EtherSound 帧,发送频率就是音频采样频率,后面的设备与它进行同步。需要注意的第一个问题是这个帧的数据量永远是恒定的,与其中是否传输音频信号或者传输多少通道音频信号无关;第二是由于没有同步延时矫正,所以 EtherSound 数据流每经过一个设备就要增加一点延时,同步具有相对性;第三就是这个数据流可以比做是增加了以太网报头的“IEEE1394”结构,所以所有设备都不具备识别以太网 MAC 地址的能力,也就是说它们不是通过以太网的MAC地址寻址方式通信的(CobraNet 是通过 MAC 寻址),这样来的好处是避开了以太网封装/去封装过程,使得网络延时大大缩短,不利之处就是网络中不能包含有任何其它数据格式的数据,当然也包括普通IP数据,因为所有的 EtherSound 设备无法识别这些“杂质”,这使得 EtherSound 网络的扩展功能变的复杂化。

  5、内核原理对比

  a、CobraNet内核结构

CobraNet与EtherSound音频传输技术比较

  上图中的左侧四个接点为输入内容,除了基准时钟信号外可以传送同步音频数据和非同步的串口和IP数据。通过 DSP 将同步数据与基准时钟同步,以确定如何将同步音频数据流“切割”成以太网数据包分发出去,并且利用同步周期内的空余时间将非同步串口和 IP 类型数据分发出去。“Ethernet MAC”负责把全部的数据包按照 MAC 地址包装成符合以太网要求的格式,在定时器( OP Timer)的控制下有节奏的通过以太网线圈(Ethernet PHY)发送到网络中去。

  随着技术的发展,很多复杂的功能可以编程到 IC 模块中,而且远程控制和升级非常容易,最关键的是制造成本大幅度下降了。这些技术在 CM-2标准模块中都得以实现,见下图。

CobraNet与EtherSound音频传输技术比较

  CS1810××/CS4961××系列芯片集成了大部分 CobraNet 合成功能,其它厂家只需要添加进来几个通用的以太网芯片(类似于制造网卡)就可以生产 CM-2了。

  b、EtherSound内核结构

CobraNet与EtherSound音频传输技术比较

    上图是标准的 ES/ES100/ESGiga 设备,右侧红线标注的100M 以太网接口在ES设备上没有,其它两种设备上有。这是因为我们先前讨论的那个问题,因为 EtherSound 数据流为了降低延时,采用了类似 IEEE1394总线结构的数据包,并改换了报头去适应以太网,但是由于它终究不是 MAC 类型的以太网分发协议类型,所以不能在以太网络中和其它类型的数据混合传输,为了克服 EtherSound 的控制信号传递缺陷,厂家从模块的 FPGA 打开了另外一个以太网端口(其功能和 RS232端口非常类似,只是输出格式不同而已)。但是要注意的是这个端口不能和音频 EtherSound 网络共用一个VLAN,需要另外建立网络系统,这样做的好处还有配置电脑无须连接到“Primary Master”上也可以工作了。

  EtherSound 的 FPGA 内核是存放程序和数据的地方,所以寄存器的大小直接决定了音频的传输能力。ES 系列寄存器有两种,一个是 MSx 88 EepROM 200k DR 可以提供8路输入/8路输出的能力,另外一种是 S2 PROM 100k DR 的小容量存储器 FPGA,只能提供2通道音频输出的能力。

  6、延时对比

  a、CobraNet延时特性

  CobraNet 设备之间传送数据采用 MAC 寻址方式,所以数据延时主要取决于以太网封装/解封装、网络传输延时和交换机延时。在这个过程中的网络延时(主要是网线或光纤)通常是几个微秒的数量级,而交换机也只有几个~几十个微秒的延时,可以忽略不计。对于以太网封装/解封装以及 CobraNet 编解码是固定的1.33ms、2.66ms 和5.33ms 三种(在一个固定的网络结构下,同一时间只能采用一种延时)。这三种延时可以是用户在 CM-1(或 CM-2)上根据需要自己设定。一般来说长延时(5.33ms)应用的时候数据包长度比较大,数据误码率小,芯片工作压力小寿命比较长,所以这是厂家比较推荐的,尽管这个延时相对比较长,但是在工程应用中看5.33ms 相对于人耳的延时也是可以忽略不计的,只是对于一些现场演出的场合要求延时比较苛刻的时候,可以选择2.66ms 或者1.33ms。在这种前提下,还不如采用 EtherSound 技术更能缩短这个延时了。由于 CobraNet 采用了MAC地址寻址方式传递数据,所以网络中任意一对发送/接收器的延时都是相等的,与设备在网络中的相对位置无关。CobraNet 采用 Conductor 设备作为同步信息包 Beat Packet 的分发者,其同步能力是受到 Beat Packet 的同步报文长度限制,所以一个 CobraNet 系统最多只能同步120个 CM-1/CM-2个传送器。在星型网络架构下,只要干线交换机总带宽足够,那么一个 CobraNet 系统最多可以同时传送960个音频通道。

  b、EtherSound延时特性

  EtherSound 是采用 DownStream 方式传输音频数据流,由于不依赖于以太网的 MAC 寻址方式,而且具有固定的报文长度,并依靠以太网前导字符串做自同步,这些条件促使了 EtherSound 无须花费更多的时间去处理复杂的以太网数据传输关系,类似于IEEE1394这样的总线传递时间就可以完成。EtherSound 的网络延时最主要就是建构 DownStream 数据流需要花费6个采样时间(若音频采样频率为48kHz 时,一个采样时间就是1/48000s,那么6个采样就是125μs,这个时间长度是固定的)。按这样计算,若一个音频输入信号通过了3个 ES 设备和一个存储-转发型交换机并输出的话,那么它的总传输延时见下图的计算分析:

CobraNet与EtherSound音频传输技术比较

  若采用菊花链型网络结构,那么每增加一个ES节点,一个网络 DownStream 只增加了2μs,即使增加了10个 ES 设备才相当于一个采样时间的宽度(1/48000s)。可见这么短的延时量用在现场演出系统中是无法察觉的。由于 EtherSound 技术是基于总线传输方式发展起来的,它的自同步方式决定了其接力传输距离理论上可以无限制的远,只是从输入到输出端,每增加一个 ES 节点就增加了2μs 而已。另外一个引入的问题就是采用共享带宽的结构以后,一个 EtherSound 系统的单向最大传输能力被“Primary Master”限定在64个通道。若要增加传输能力只能依靠扩展总带宽来实现,如 EtherSound Giga 系统采用了1000M 网络结构,可以单方向传输512个音频通道。

  7、传输安全与网络管理对比

  a、CobraNet传输安全与网络管理方式

  CobraNet 网络可以并存在通用的以太网系统中,所以网络中的其它类型数据包(如IP数据包)可能会和 CobraNet 数据相互影响。当未知的 CM-1/CM-2设定在一些广播数据包接收或高优先级单播数据包接收状态下,可能会出现信息泄露问题,此时可以采用私用(Private)高 Bundle 号码(65280~65535)方式进行传递。采用 Private 方式传递信号必须要求发送和接收设备之间以固定的,MAC 地址互相绑定,这就可以完全避免信息泄露问题了。

  CobraNet 目前全面支持 SNMP v1版本,使用任何标准的 SNMP 管理程序和 MIB 文件可以访问/控制 CobraNet 参数,这个特性对于工程应用和大型网络系统管理的角度看是相当必要和重要的。

  b、EtherSound传输安全与管理方式

  前面说过 EtherSound 数据流是一种不完全的“准以太网”协议,它不可以和其它网络协议数据在一个VLAN中共存,所以这种“排它性”相对来说是比较安全的,只是网络中如果插入一个未知设备来窃取音频信息,这是很难防范的。另外还是因为这个“排它性”,所以它也不能接受开放的第三方管理数据。在 ES100和 ES Giga 发明以后,EtherSound 模块增加了另外一个LAN端口可以接受管理,通过这个端口间接地管理ES通道部分。

  8、对比CobraNet与EtherSound综述

  总结前面两种技术的对比,我们可以用下面这个表格概括一下。

CobraNet与EtherSound音频传输技术比较

  得出的结论就是: 

  这两种技术都有各自的优势和劣势,根据不同的用途来选择不同的传输技术。一般会议/广播工程设计偏重功能性和扩展性,忽略超短延时的要求,应该使用 CobraNet;现场演出场合偏重超短延时和快速设计安装的需求,忽略复杂的功能和网络管理能力,应该使用 EtherSound 技术。

  从技术的发展上看,两者技术都明显存在互相学习和相互借鉴,这对消费者无疑是个好事,相信将来两者之间的差异性也会逐步缩小。但是两者毕竟是在不同的平台下发展起来的以太网传输技术,它们都有一些技术存在无法逾越的鸿沟,有些问题可以借助与以太网的发展而逐步解决,而有些问题可能永远停留下来了。作为使用者,我们只要明白它们各自的优势和缺点,扬长避短,按需所取即可。

PeakAudio Digigram CobraNet EtherSound

视听科技视频号 广告
发表评论