【内容摘要】 本文详细阐述了几种数字接口的发展过程及其各自特性和原理,力求简单通俗的让大家对数字接口有充分的了解和掌握。
【关键词】 数字接口 传输 连接
近年来,随着数字音频技术的发展,数字音频设备的应用越来越广泛,除了早期的CD机外,数字调音台、MD录音机、数字音频工作站等数字音频设备大量涌现。数字音频设备具有的高性能指标自动化多功能的优点,使之应用十分广泛,发展十分迅速。
数字设备在进行信号处理时有不同的方法和格式,其输出的信号格式也不相同,因此存在着不同的数字接口,用户在使用设备时必须搞清楚这些接口,信号才能正确的互相传输。
数字音频信号的优点之一在于其传输过程中可以多次被完整地克隆,并且不会有人耳可以觉察到的音质损失。在模拟领域中,当信号在模拟磁带录音机之间进行传输时,在传输过程中由于种种原因,在每次拷贝之后都会引起信号信噪比的降低(即便在最理想的情况下也会有3dB~4dB的SNR损失);频响失真的提高以及由于设备传动系统所引起的抖晃率的增加。在实际工作中必须使用标准的数字信号传输接口或电缆,具体阐述如下。
一. SDIF-2接口
SDIF(Sony Digital Interface Format索尼数字接口格式)是较早开发的一种音频接口格式,系统在早期被称为SDIF,但由于较高格式SDIF-2的开发而被舍弃,目前称之为SDIF-2。由SONY公司开发的SDIF-2主要用于CD母盘处理设备之间(例如SONY PCM-1630,以及它的前身PCM-1600或PCM-1610)数字信号数据的传输。系统采用两个电缆随一个同步信号传输电缆来传输立体声信号,因此在PCM-1630的连接面板上共有6个使用同轴电缆的BNC接口,分别为2个数据输入,2个数据输出,1个时钟信号输入和1个时钟信号输出。另外,目前较新的产品还可以通过一个8针式接口的电缆(通常被称为复合数字接口)来传输所有这些数据。在SDIF格式下,信号以32bit信号包,串行模式进行传输,并且在32bit中,只有29个比特用来传输数据信息,而剩余的3个比特则用来表达同步信息。在29个数据信息比特中,前20个比特均用于传输数字音频信号,但在接口只传输16-bit信号的情况下,剩余的4个比特则表示为0。除了音频数据之外,第26和27比特主要用来通知信号接收设备是否原录音信号带有加重处理(加重处理主要是进一步提升在量化噪声之上的高频信号,以补偿防混叠滤波器对高频信号的衰减),第28比特为拷贝保护比特,第29比特用来标明同步数据块的起始点,从第30到32比特承载同步信息。
二. AESEBU接口
就像很多其他公司建立自己的数字信号接口标准一样,AES也规定了自己的标准传输接口,被称为AES3,同时被欧洲广播联盟(EBU)所接受,所以被统称为AESEBU数字接口。和SDIF-2系统一样,在AESEBU标准中,音频数据和子码数据同时以串行的模式进行传输,但不同的是,AESEBU系统使用一个平衡电缆(XLR三针卡侬接口)来传输两路立体声信号,接口标准接近于IEC-958模式1标准。不同于SDIF-2接口(其使用长度受到很大的限制),AESEBU格式的电缆可以在没有均衡补偿的情况下,其使用长度可以达到106m(350英尺)。由于AESEBU信号使用FM声道编码以及自时钟控制,所以不需要单独的时钟信号连接电缆。在数据传输中,每个属帧包括32bit信息,其中包括24bit量化的音频数据、8比特量化的子码区域、声道定义(左或右)、声道状态、同步信息以及用户数据码。
三. MADI接口
MADI(Multichannel Audio Digital Interface 多声道音频数字接口)又被称为AES10(被称为AES10-1991和ANSI S4.43-1991标准)。和其他两声道数据传输系统不同,MADI格式主要实现了数字多轨录音机和数字多轨调音台,以及和其他多轨数字录音系统之间的多轨形式的连接。MADI格式采用一个使用距离最长可达50m的同轴电缆(BNC连接头)和一个承载时间码数据的同步电缆同时传输56个声道信息数据。相对于AESEBU系统中,采样频率控制传输声道的数率的模式,MADI系统的数率被固定在100MBS,同时56个声道必须使用相同的采样频率。MADI系统从声道0开始到声道55,按串行模式传输56个声道数据。MADI的声道格式是以AES-3格式的属帧格式开发的,但与AES-3不同的是前4个比特的安排,所以在MADI属帧的32bit的排列顺序为4个模式识别比特,20个音频信息比特,然后是V,U,C,P比特。其中头4个比特分别负责提供帧同步信息,识别声道处于开启还是关闭状态,对立体声信号进行左右声道判断以及指明数据块的起点。
四. SPDIF接口:SPDIF(SonyPhilips Digital Interface Format索尼菲利浦数字接口格式)
由AESEBU格式发展而来,同时与AESEBU享有很多共同的特性,但主要用于民用设备连接的SPDIF格式中的声道状态数据块的安排和专业AESEBU有很大的不同,其串行比特被安排为24个8bit字节(共192比特),其中只有前4个字节(0~3)被定义,而后面从字节4到字节23共20个字节则处于保留状态。其中在字节0中的比特0被设定为0,代表系统用于民用领域;比特1代表承载数据是否为音频信号(0代表音频信号,1代表非音频信号);比特2代表拷贝保护状态(0代表拷贝收到保护,1代表拷贝不受保护);比特3代表前加重的使用情况;同时如果比特1显示为音频数据的话,比特4和5将代表两个声道的音频信号,比特6和7用来设定字节1~3的模式(一般设定为模式00)。在字节1中的0~6比特负责定义索引编码来识别设备所传输的数据的类型,在模式00状态下,这些比特将用来通过定义不同的属帧结构来定义不同的数字设备和不同的信号传输格式,其中包括CD、MD、DAT以及采样转换器等等。而在第一个字节中的第7个比特(数据块中第15个比特)则用来识别所传输的数据是原始数据还是拷贝数据,也就是说用来定义SCMS即串行复制管理系统的状态。当录音机上的SPDIF输入接口接收到专业AES3信号数据中的拷贝保护指令的话,系统将拒绝录入数据流。字节2用来表示音源的代号及声道号码,而字节3则用来表示采样频率和时钟精度。SPDIF格式属于IEC-958模式I标准,并且因为作为民用格式来说并不要求使用低阻抗平衡电缆,所以SPDIF采用绝对值振幅为0.5V、阻抗为75、最大使用长度为10m的同轴电缆(或被称为Cinch接头),一些民用设备在连接距离低于15m的情况下使用Toslink接头,塑料光纤电缆(玻璃光纤可以用于1000m以上的距离)。 [Page]
五. 光纤接口
在数字设备之间使用光纤电缆进行连接,改变了上百年来铜线在音频领域中的主宰地位。光纤信号传输原理近似于海军使用的灯语,模拟或数字电信号通过信号传输器被转换为光信号,并以恒定的开或关得形式(分别代表数字信号中的1和0)在光线电缆中传输,光信号源通常为发光二极管(LED)或激光二极管(LD),并通过透镜聚焦将信号送入电缆。其中LED的信号发射面积较大,但信号质量不如LD,只能在较短的距离内使用,而尽管LD具有较小的信号发射面积,同时可以和光线电缆连接输出较大的信号功率但无法在较大范围的操作温度下使用,同时造价昂贵。光信号通过光纤电缆后在信号接收端通过PIN光敏二极管或具有自身增益功能的APD雪崩光敏二极管将光信号转换回电信号。光纤电缆具备有利于音频信号传输的种种优点,例如完全没有电磁干扰、较低的信号衰减、高带宽、很少的信号传输延时以及低比特错误率等等,并且重量轻体积小,同时由于光纤属于非金属材料,所以不会有接地回路的问题产生。具有1Gbs信号传输率的光纤电缆非常普遍,一些实验光纤系统甚至可以在较长的距离内达到30Gbs的传输能力。尽管光纤电缆在连接很多电气系统的时候,需要信号中继器来提升信号值,弥补信号传输损失,但氟化物光纤则可以在使用中继器之前,将信号高质量的传输上千米。氟化物光线是由氟化物玻璃做成的光纤,这种光纤原料又简称ZBLAN。光纤尺寸微米测量,典型的光纤直径在10m~200m之间。
光纤电缆从里到外共有三层,即由玻璃或塑料材料制成,负责传输光信号的纤芯层,负责将光信号反射回光纤纤芯的被覆层以及最外层的缓冲屏蔽层。其中由玻璃或者塑料材料制成的被覆层是非常有效的反射层(但其对光的折射指数应低于纤芯),当在纤芯中传输的光束遇到被覆层后,如果光束和被覆层内壁所形成的角度小于临界角度,将被部分反射回纤芯,同时部分光束一折射的形式进入被覆层,而如果大于临界角度的话光束将被全部反射回纤芯层,被称为完全内部反射。因此,如果由纤芯传导的光束的入射角均大于临界角度的话,信号质量仅受到光吸收和接口损失的影响。临界角度取决于纤芯和被覆层的折射指数。由于光信号进入纤芯角度的不同,造成不同光束到达接收端的时间也不同,从而产生“拖尾效应”并因此限制了系统所能传输的最大频率。简单地说,光束在电缆中的数量越少,所能传输的带宽就越大,并且数量多少可以通过纤芯层的直径来控制。光纤根据光束被传输路径的数量(一个或多个)大致可以被分为单一模式光纤和多重模式光纤。其中单一模式光纤使用较小的纤芯(大约3.5×10-4英寸或9m直径)来传输波长为1300nm~1550nm的红外线激光。多重模式光纤具有较大的纤芯(大约2.5×10-3英寸或62.5m直径),
由发光二极管(LEDs)来传输波长在850nm~1300nm之间的红外线光。一些由塑料制成的光纤电缆使用更大的纤芯直径(0.04英寸或1mm)来传输波长为650nm的可视红光。尽管在光纤电缆中的被覆层可以对光实行完全的反射,使信号可以在较长距离内进行传输,但信号的损失却通常发生在纤芯层自身,其主要决定于纤芯层所使用材料的纯度和所传输光的波长。光信号的损失通常以固定波长的激光在固定电缆长度上(1km),用dB形式表示的光功率的损失,例如在多重模式光纤中,所传输的光信号的波长为850nm所代表的信号损失为60%km~70%km=4dBkm,而1300nm=50%km~60%km=2.5dBkm。目前有一些质量较高的纤芯表现出较低的信号质量损失,在传输波长为1550nm的光信号时,其损失度一般可以低于10%km,在表0.5dBkm。如果使用塑料作为纤芯材料的话,其信号损失程度为1000dBkm,因此玻璃通常被认为是上等纤芯材料。光纤电缆通常适合使用在可见光和近似于红外线波长的范围,并以此将信号损失降到最小。在上述中提到的三种波长的激光,即850nm、1300nm和1550nm是目前使用最多的激光,分别代表的带宽为35300GHz、230000GHz以及194000GHz,其中1300nm激光主要负责信号数据的长距离传输;850nm激光则用于短距离数据传输比如局域网(LANs-Local area networks);1500nm激光由于通常用于波长复用器,因此其设备可以承载850nm或1300nm的激光。单一模式系统通常使用在1310nm~1500nm波长范围内,而800nm~900nm波长范围内是多重模式系统的优选操作范围,并且一般来说塑料光纤所使用的理想激光波长为650nm。根据上述可知,光纤电缆所传输的波长越大,信号衰减度就越小。一般在800nm~900nm范围内的衰减度为3dBkm~5dBkm,在1150nm~1350nm范围内的衰减度0.5dBkm~1.5dBkm,而1550nm激光波长的衰减度则低于0.5dBkm。
六. IEEE1394火线接口
IEEE1394火线接口是美国电气及电子工程师协会委托的一个技术工作小组所设计开发的一种新的数据总线传输协议。以苹果电脑的火线协议为基础,IEEE1394~1395高质量串行总线标准为背板总线和串行数据总线在结构和控制上均作了明确的定义,以求在数据传输上实现价格低廉、用途广泛,以及高速等特点。IEEE1394电缆总线是一种通用且平台相对独立的数字接口,可在数字设备之间进行连接实现高速数据传输,例如PC、打印机、扫描仪、数码摄像机,以及其他用于多媒体的音视频设备。
IEEE1394电缆包括有两个相互独立的屏蔽绞和线对来实现对信号的双向传输及接收,两个供电导线(8V~40V,1.5A)和一个屏蔽线。相对于上述6条导线,或者说是6针火线接口格式来说,Sony公司开发了没有供电连接的4导线模式,被称为4针火线接口格式,并主要用于民用音视频设备的连接,该4针火线接口格式被定义为1394.1,有时也被称为i.link。在不使用中继器的情况下,两个设备之间的火线电缆长度可达4.5m,被称为一个跃距,跃距数量多可达16个,因此在使用标准电缆的情况下可以将设备之间的距离拓展到72m。IEEE1394在信号传输上定义了三个层面、即物理层面、链接层面和执行层面,其中物理层面定义了IEEE1394总线所要求的传输信号,而链接层面负责将来自物理层面的原始数据格式化为可识别的IEEE1394包,最后的执行层面将该IEEE1394包付诸应用。IEEE1394电缆标准同时还定义了三种数率,分别为98.304Mbs、196.608Mbs、393.216Mbs,并通常按其近似数值100Mbs、200Mbs、400Mbs被称为S100,S200以及S400(目前提议的1394b格式的数率为800Mbs~3.2Gbs)。在IEEE1394的特性中包含了“音频及音乐数据传输协议”即AM协议(Audio and Music Data Transmission Protocol)。AM协议又被称为IEC61883-1FDIS标准,该协议主要定义了如何使用等时包将实时数字音频信号通过IEEE1394进行传输,其中的数据类型包括IEC-958及原始音频采样,MIDI文件。AM协议以及未来的多声道模式将为DVD-A的9.6Mbs数据流提供足够的传输带宽。并且运用拷贝保护技术来防止高质量DVD-A信号受到盗版侵害。通常来讲,在很多领域中,传输数据的保密性非常重要,因此IEEE1394作为双向传输电缆同样用于DTCP(Digital Transmission Content Protection 数字传输内容保护)系统,来保障在家庭环境中传输数字数据的安全性。DTCP可以在允许为以一定目的进行合法信息拷贝的同时,保护未经拷贝授权的数字信息内容。DTCP在每个数字链接上使用加密处理,使每个在连接链上的设备必须服从已着床的拷贝控制信息,即CCI(Copy Control Information)。在CCI中,DTCP规定了一系列拷贝使用模式,其中包括“拒绝拷贝”(不允许任何拷贝)、“拷贝一次”(只允许做第一代拷贝)、“拷贝限制”(防止进行拷贝的拷贝)以及“自由拷贝”(无拷贝限制)。DTCP技术目前被广泛用于HDTV接收器、数字电视机顶盒、卫星信号接收器以及其他民用设备。 [Page]
目前,由YAHMHA公司推出的mLAN(Music-Local Area Networks音乐局域网络)可以通过IEEE1394来传输原始音频信号、MIDI文件以及AES3信号,并可将数字时基抖动降低到20ns,如果和PLL(锁相环)共同使用,可进一步将这种时基错误降到1ns。mLAN特性的一部分被1394贸易协会所采纳用来通过IEEE1394火线控制音频及音乐数据。
IEEE1394属于非专有的标准,因为很多标准组织以及公司参与了标准的建立,例如数字VCR协会选择了IEEE1394作为他们的标准数字接口、VESA(Video Experts Standards Association 视频专家标准协会)将IEEE1394用于家庭网络中、欧洲数字视频广播组织也使用IEEE1394作为数字电视接口、微软在Windows98系统中首次使用IEEE1394等等。
七. USB接口
USB为英文Universal Serial Bus的缩写,代表通用串行总线。USB技术主要是在Microsoft公司于1994年提出了即插即用方案后,于1996年召开的面向PC机硬件技术工作者会议上时,由Intel、Microsoft、Compaq、IBM、NEC、Northern Telcom等几家大厂商发起的新型外设接口标准。使得计算机在和其他外挂设备相连时,相对于原先所使用的接口,比如串行或并行接口,或是需要打开主机进行插卡安装的方式来说,具有方便、快捷的优点,并可以通过串联的方式连接共127个外接设备(SCSI最多只串接7个设备),比如打印机、扫描仪、鼠标、数码相机、音箱、调制解调器等等。USB连接头按信号传输方向分为A和B两种,其中上行口A连接主机而下行口B(10.6mm12.0mm)连接外接设备。
除了上述特点外,单一USB电缆的使用长度可达5m,并在使用USB集线盒(USB插座)的情况下外接设备和主机距离最多可达30m。在阻抗为90ohms的USB电缆中共有四条导线组成,即两条电源线(+5V和接地)和一对绞合线来对来承载信号数据。通过USB连接的设备可以实现SCSI所无法实现的热插热拔,并可以随主机进入省电模式后进入睡眠状态。USB设备存在两种供电方式,即自供电方式和总线供电方式,在USB电缆的四条线中,第一针承载5V电压供电,第四针代表接地。在总线供电中可以分为两种,其中低功率设备在总线处所吸取的电流不高于100mA,而高功率设备在总线处所吸取的电流将达到500mA。另外一对线,在第二,第三针上表示为D+和D-为传输数据的绞合线对。USB数据使用NRZI编码(0代表信号变换,1代表信号没有变换),以同步串行比特流的形式进行传输,同时使用比特填充技术(Bit stuffing)来取得足够快的信号变换速度以确保信号接收端不会失去同步。在USB电缆内,时钟信号和数据被共同传输。USB设计有两种不同的数据传输速度,其中在12Mbitss速度下必须使用屏蔽电缆以取得足够的抗噪以防止电磁干扰(EMI)能力。另外,USB2.0的最高传输数率可达480Mbits。USB接口定义了四种数据传输种类,包括控制传输、中断传输、同步传输以及批量传输,同时就USB所具有的两种传输通道类型来说,控制传输使用信息通道(Message Pipe)用于命令及状态操作,而中断传输、同步传输以及批量传输则使用数据流通道(Stream Pipe),其中键盘和鼠标使用中断传输种类,视频和音频信号由于以时间概念为基准故尔选用同步传输种类,批量传输可以在所有带宽范围内传输非时间基准的数据例如打印机。
在USB总线协议中,通过总线对信息进行传输被称为信息处理,并且主控系统将随时具备信息处理清单,随时处于工作准备状态。这种信息开始于主控系统发送用来代表信息传输种类以及方向的信息包(7-bit USB设备地址码以及终端代码),该信息包被称为标记信息包(Token Packet),并使用ACK、NAK以及STALL代表数据传输的三种结果,其中ACK代表数据被接受;NAK代表数据被拒绝;STALL代表数据在终端停止。USB所传输的信息量使用以帧为单位的时间进行调整,或者说USB将数据带宽以帧为单位进行划分,其中每帧的长度由总线时钟进行控制,每秒1000帧即每帧的长度为1ms,或者说每毫秒代表一个新帧的开始没并且在每帧的起点有SOF(Start of Frame)信息包被发送到总线,以保证等时设备和总线实现同步。在这里帧是总线在不同外接设备之间进行总线带宽分配的关键。其中在每帧中应至少有10%的时间应使用在控制传输种类中,并且这个比例仍可以随系统软件而提高,因此在每帧中用于信号传输的空间应少于90%。除了上述内容外,在每帧内部分或所有剩余的时间应被数据传输通道保留用于等时设备。其实在数据通道建立时,分配在每个通道的信息部分或信息量已被确定,以确保在每毫秒内所传输的数据总量的精确性。对于音频或其他等时设备数据传输来说,主控或数据输出设备必须对数据进行数值为1帧的缓冲处理,并在数据接收端进行缓冲解除处理以恢复信号的实时状态。例如一个44.1KHz的采样的音频信号,在输出端将按每帧44个采样点状态输出9帧,然后再输出一个具有45个采样点的帧。
在2000年4月27日推出的USB2.0版本(又被称为高速USB)为原USB1.1的升级版本,除了为多媒体及存储系统提供更大的带宽之外,其数据传输速度可以达到USB1.1的40倍,其支持的三种速度模式分别为每秒1.5、12以及480Mbs,并可以同时支持低带宽设备例如鼠标、键盘以及高带宽设备例如扫描仪、打印机和其他大容量的存储设备系统。B&P