介绍
在最基本的层面上来讲,系统有效性是指系统在需要时可以成功运行的概率。高系统有效性这一术语被广泛地用于一切与生产力有关的事物,包括可靠性和可维护性。通过高有效性,可以构建冗余和可恢复性系统。该系统激发了连锁反应,用光纤基础设施完成设置,能够提供各种容错级别的产品和解决方案。特别值得一提的是,光纤矩阵路由和扩展解决方案,不仅可以提供模块化冗余系统架构的机制,还具有高带宽、低成本、支持复杂的拓扑结构等优点。因此,Thinklogical公司设计了一套基于光纤的冗余矩阵路由和扩展解决方案,以满足在模块化冗余系统中进行可靠信号传输的需求。
冗余和可恢复性系统的高有效性
冗余涉及到多种技术,这些技术都与物理备份有关,而弹性则主要与通信协议有关。冗余设备在发生故障时可以激活,但如果没有很好的弹性,就有可能丢失数据,甚至会发生无法建立冗余连接这种更糟糕的情况。弹性系统在发生故障时会返回到一个可操作状态。因此,如果一个故障使系统离线的话,高度弹性的系统可以在最短的停机时间内恢复其预定的工作和功能。
建立冗余和可恢复性系统,需要进行全盘考虑。必须逐一考虑每个潜在的风险,不仅要考虑如何降低风险,还要保证如何最大限度地减少其对系统的影响。冗余系统的要求或需求基于以下一套标准问题:
·系统是否需要全天候运行,停机是不可接受的吗?
·如果系统发生故障,是否需要无缝地从主系统切换到备份系统?
·信号源和目标地之间数据共享的恒定和可靠要达到什么样的程度?
·怎样才能尽量减少系统内的单点故障,如何确保构建基础结构的设备不会使系统整体停止运作?
通过冗余和容错实现的高有效性,是许多矩阵路由和扩展设备的重要组成部分,尤其是在安全可视化计算环境中。如果说几分钟的企业系统故障只是一种不便的话,那么失去安全可视化计算系统则是一场灾难。如果控制系统不起作用或显示不良会造成经济的重大损失、设备损坏、扰乱公共服务和/或安全的话,通常就需要使用某种形式的冗余和容错。这些情况下的冗余意味着双重甚至三重设备备份,在主设备出现故障时能够无中断运作。在这些类型的使用环境中,故障成本太高,冗余系统是至关重要的。
通过使用光纤解决方案来设计冗余系统,用户可以享有高度可靠的数据传输、降低安装成本以及保证根据需求的改变进行升级。本文将讨论几种不同的基于光纤的冗余和容错功能以及结构,但主要集中阐述双模块冗余,也称为并联冗余,这正是Thinklogical公司的系统所采用的方法。本文还将突出介绍一系列有助于提高系统有效性的Thinklogical公司的产品。
组件的冗余
确保可靠运作最重要的一步就是能提供冗余的、热插拔的组件。系统的模块或组件能够无缝地被去除、更换或增加也是很关键的。更换也不应该需要重新布线或重新编程。此外,目前也发明了许多新方法,比如一种基于状态的管理以及能够自动学习的诊断程序,就可以提高控制器检测、通知并描述组件故障的能力。对许多用户来说,无需关闭系统就可以进行维护和修改系统的功能是非常有用的,尤其是如果这种改变或维修能够在几分钟内完成的话。
系统的关键组件
● 不间断电源(UPS)
● 冗余供电
● 冗余组件
·机箱·处理器
·I/O模块
·传感器和驱动器
·计算机/用户界面
·网络
·媒体
·服务器
·数据库
Thinklogical的系统应急
电源的冗余是一种常用的增强系统有效性的方法。单电源故障会造成灾难性的后果,带来巨额的经济损失。在这种苛刻的条件下要确保系统的完整性和性能就需求采用电源冗余。因此,所有Thinklogical的矩阵路由和模块化扩展产品都配备有冗余的支持热插拔的电源。
Thinklogical的VX和HDX系列矩阵路由器的关键组件设计都支持热插拔,比如风扇和光纤插座(SFP+),从而尽可能地减小了某个组件发生故障对业务系统的影响。热插拔的I/O板卡也提供了优秀的在线扩展能力,不用关闭矩阵路由器电源中断信号处理就可以进行重新配置。此外,HDX系列矩阵路由器配有双控制卡,在发生故障时可以在两块卡之间进行切换。

冗余模式
在行业中有许多通用的冗余模式,比如备用冗余和双模块冗余,或叫做并联冗余。
备用冗余
备用冗余指的是有一个一样的备用设备作为主设备的备份。在备用冗余里,备份设备不分享任何的负载,只有在主设备发生故障时它们才会被使用。此外,可能要由第三方来监视系统,并在需要时给出切换命令。
在备用冗余中,备份设备的设置有三种状态:冷备份、热备份和在线备份。在冷备份中,为了保护备份设备的寿命,电源是关闭的。这种模式的缺点是需要用很长的时间来使备份系统启动并运行。虽然硬件和软件都是可用的,但都需要通电才能进入当前的操作状态。
热备份响应时间更快,因为备份(冗余)系统一直在运行,并且定期与控制设备(DUC)进行同步。在主系统发生故障时,冗余系统可以从故障系统中断开,并接入备份系统。这使系统可以快速恢复(通常在几秒钟内)并继续工作。尽管在断开/重连的过程中会丢失一些数据,热备份在那些对少许数据丢失不敏感的领域内是一个可接受的方案。
在这两种类型的冗余模式里,系统的切换都不是无缝的,也增加了故障的概率。为了消除这种增加的概率,需要在冗余系统中增加额外的硬件(第三方选择器)来帮助系统从主设备切换到备份设备。虽然这些系统组件增强了可靠性,但它们通常是串联,这就造成了一种串并联的连接,又为系统带来了新的故障点。此外,因为增加了额外的硬件设备,这种系统的成本通常会翻倍。
在线备份意味着主、备数据系统同时运作,并同时提供同样的数据流给下游用户。如果主系统出故障了,那么切换到备份系统是完全无缝的,或者说是“无冲击的”,也不会丢失数据。用户如果无法容忍冷备份和热备份系统的数据丢失,那么在线备份就是最佳的选择。在线备份模式也会有一些变化,比如双模块冗余或叫做并联冗余。这些模式之间的主要区别是看主系统和备份系统之间的同步有多紧密。[page]
双重模块冗余(DMR)或并联冗余
多个设备并联并完全同步的运行,这种方法被称为DMR或并联冗余。这种模式的特点是切换时间非常短。
双系统冗余具有以下三个基本原则:
1、物理隔离的信号路径
2、双机箱冗余的信号控制器
3、状态信息同步
一套DMR矩阵路由和扩展系统配置了两台并联运行、紧密同步的主路由器和备份矩阵路由器。同一个信号同时传输到两台镜像矩阵路由器中,再把这些信号发送到目的接受端。如果有多个矩阵路由器的话,你就要辨别哪一个信号是正确的,这是个问题。不对运行参数进行动态检查就武断授予一台矩阵路由器优先权,选择一个你“最相信”的设备是不可取的。同时,监测并决定什么时候切换到备份设备也是很复杂的。
Thinklogical的优势
Thinklogical公司设计了一套经济、弹性的解决方案来解决DMR模式的复杂性。这一功能被设计在SDI Xtreme 3G+接收器中,称为“切换能力”。这使组件可以同时接收两个输入光纤上同样的数据流。默认情况下,它会通过在接收到的数据流中搜索同步字符,尝试与“主”光纤进行同步。同时,它还会检查“备份”光纤,尝试与其同步。在一段预定的时间后,会选择任何一个接收器锁定的数据流,从中解码出SDI数据。如果所选择的数据流丢失同步,接收器会自动选择其他的数据流。在切换时SDI视频只有极少的丢失。为了防止切换器在间歇信号之时来回切换,接收器会继续使用“切换过的”数据流,不管它是否重新锁定到原来的流。如果发生类似于切换过的数据流丢失锁定这种情况时,接收器会尝试切回到原来的流。
这种同步方案确保了系统中无论哪个点发生故障,都能够有最大正常运行时间。有趣的是,这种方法反映了在实现灾难恢复时共同的典型设计。事实上,绝大部分高有效性系统遵循这个朴素的设计方式:一个单独的、高品质的、多功能的具有全面内部弹性的物理系统运行相关功能,并与备份、物理隔离、完全一样的系统相配对。这种设计的首要目的是预防失效,或从失效中迅速恢复过来,这允许系统可以在任何重要组件部分或全部失效时,继续运行。
总结
冗余的想法并不难理解,但实现它却需要一些思考。最开始关于冷、热以及在线备份的决定会影响到实现时的所有方面。对一个性能良好的系统来说,选择适当的硬件和强大的系统结构是决定性的。
很显然,如果没有一个综合的矩阵路由和扩展解决方案,公司就不能充分享受冗余模式的好处。Thinklogical公司的系统解决方案为具有创新精神的公司提供了创造高密度、可升级、冗余系统结构的能力,以获得广泛的功能和高投资回报率。要记住更低的系统成本并不总是等于更低的总成本,这一点非常重要。不过更重要的是,一次意外关机的成本远远大于冗余的成本。如果数据的连通性对公司或组织是至关重要的话,那么就应该考虑安装冗余系统,并在选择关键设备时仔细进行权衡。