随着技术的发展,数字化、网络化的检测设备不断出现,智能化的检测手段日益成熟,有了这些条件作为基础,建设一个全面的自动化的检测系统就有了可能。这些年来,我们在系统运行方面又逐渐积累了一些经验,可以提出真正符合实际的需求,将二者结合起来,对检测系统的设计、改造将非常有益。同时,技术指标测试容易被忽略,其实这是检测系统很重要的一个组成部分,可以保证系统始终运行在正常状态。经过实践和探索,针对检测系统有了一些体会和思考,对其发展趋势有了一些了解,下面就是一些叙述,仅供参考。
一. 检测系统组成
检测系统通常由基于信号和基于设备两部分组成。对于播出系统来说,基于信号的检测是第一位的,它可以实时定位故障点,为应急处理提供准确的资料。而设备的检测也是很重要的,它可以使我们全面了解运行状况,预先发现事故隐患,将其消灭在萌芽状态。
1.信号层面
(1)硬件选型
目前,从信号层面来看,各个设备、板卡、机箱等是具有检测信息的,但是经过实际测试,我们发现只有在“没有信号输出”(no signal)时才会报警,带有同步信号的黑场、静帧都不行,有的甚至是在信号线断开时才报警。而数字信号最常见的故障现象是画面静帧,这样看来,通过板卡等的自身的报警功能是达不到我们的要求的,需要采取其它的方法。我们知道,多分格器是能够对输入的信号进行画面静帧的报警的,而且可以根据频道播出节目的特点进行持续时间长短的调整:新闻类要求高,时间设定要短;戏曲类则可以相对较长一些。这样可以将系统通路上各个重要设备的输出接入多分格器,就可以实现信号的检测了。尤其是末级输出信号,要格外加以重视,因为它的正常与否决定了系统的最终运行状态。可以采取声画两种报警方式,提醒值班人员,及时进行应急处理。
(2)报警方式
检测系统搭建好了以后,信号的报警方式主要有以下两种:主动巡检或TRAP方式。主动巡检是指报警服务器按照一定的周期查询所管理的各个设备,出现报警信息即进行采集、分析后告警。TRAP方式则不需要报警服务器进行定时查询,设备只有在出现故障时才发出报警信息。主动巡检可以使我们及时全面地了解各个设备的运行状况,但是所设定的周期的长短非常重要。过短对设备会造成过于频繁的访问,从而给其造成过重的负担,影响正常运行;过长则有可能错过报警信息,影响故障的及时处理。因此需要根据系统实际的运行状况来选取适当的周期。TRAP方式则省去了周期性的查询访问,但是要更加注意防范设备死机,要注意两者的区别,以防设备已经死机了,还没有察觉,从而影响安全播出。总之,两种方式各有利弊,设计时要统筹考虑。
(3)通路设计
在将各个设备接入系统后,要经过综合的调试,从而形成一个统一的整体。在信号的通路报警上,首先要将各个设备输出信号的报警信息进行采集,然后根据设定的规则、条件,经过分析、判断,最后确定故障点,进行报警。举例说明:一个典型的视频通路,信号源经输入分配器后进入切换台和应急开关,处理后经输出分配器送出。假设切换台出现故障,这时切换台及其后面的应急开关、输出分配器等的信号都会报警,那么如何确定故障点呢?我们知道,这时切换台前面的输入分配器的信号是正常的,将这两个条件结合起来,就可以确定故障点是切换台。以此类推,可以完成整个信号通路检测系统的设计。
2.设备层面
(1)版本信息、运行时间
从设备层面来看,主要包含以下两个方面。一个是各种版本信息、运行时间等,以前我们不太重视这个方面,认为没有什么实际的意义。其实这可以对我们了解设备运行状态、及时进行维护保养起到很重要的作用。由于现在的系统所具有的数字化、网络化的特点,为了发展的需要,设备软、硬件存在升级的需求,因此要做规范化的管理。而版本信息详细记录了设备的升级改造的状况,可以据此建立全面的设备技术档案。另外,我们知道,磁头、带库、节点等都需要定期进行清洁、维护的工作,通过记录的运行时间,可以起到及时提醒的作用,工作可以有序地进行。
(2)设备状况
我们知道,另一个方面是电源、风扇等设备的信息状况,与前一部分相比,它们对应急处理来说更为重要。设备的报警信息主要分为两个层次:
警告(WARNING):这是可能影响设备运行的信息,需要操作人员进行关注;
错误(ERROR):这是影响设备正常工作的错误,需要人工介入。
及时了解这些信息,并根据不同的情况进行相应的处理,就可以为我们提前发现事故隐患提供可能,也就为安全播出提供了保证。
在这个方面需要注意的一点是有些重要的设备像视频服务器等,其自身的报警机制已经形成了一个完整的体系,警告(WARNING)和错误(ERROR)信息多达上百条,这样当第三方对其做检测报警时要注重方式的选择、条目的挑选等。既不能因为所选择的报警信息过少而防碍了事故的发现,从而影响安全播出;也不能因为所选择的报警信息过多而加重系统的负担,从而影响安全运行。要全面考虑,根据实际的需求来制定适当的报警机制。此外,还需要注意的是我们最终的目标是在做好单一设备的检测的基础上,将它们连接成为一个整体的系统,因此在调试的时候要做大量的细致的工作。并不是一个简单的设备的累加,而是要对积累的数据做认真的分析,总结出相关的规律。通过互相的协调配合,统筹兼顾,从而形成一个有机的整体。
二. 技术测试
检测系统除了报警功能以外,技术指标测试也是很重要的一个组成部分。在系统通路中要接入技监和示波器,设置测试点。针对一些重点的设备,要加以关注。例如切换台处理器、键控器等,由于可以叠加字幕和台标,对系统指标有一定影响,易引起色度报警(chrominance warning)等,要注意进行调整和处理。技术改造和设备维护后也要进行指标测试,以保证系统始终运行在正常状态。这一点非常重要,我们在实际工作中有过经验和教训,下面就通过实例来说明。
我们的单频道机械手自动播出系统主要用于新闻类节目的播出,维护它们的稳定运行非常重要。由于系统输出的音频信号要求是嵌入方式,因此需要在末级加入嵌入器。经过多年的使用,嵌入器的技术指标有所下降,为了确保安全播出,我们进行了技术改造。为安全起见,首先在备份系统对这一关键设备进行了更换。更换结束以后,我们对系统进行了测试。发现视、音频指标有了很好的改善,但是也出现了问题,示波器显示输出信号EDH报警。 [Page]
为了解决这个问题,我们使用VM700T视音频综合测试仪进行SDI信号自动测试。我们知道,EDH即误码检测和处理,是对串行处理器中每一场视频信号进行循环冗余码(CRC)计算。EDH检查图像的三个区域,通过检测全场、有效图像、辅助数据区,来确定误码产生的个数。FF(FF-Full Field)是针对全场视频信号,它包括行、场消隐信号。AP(AP-Active Picture)是针对有效正程图像,不包含消隐信号,这区域的误码影响更为严重,因为出现在视频正程信号中,所以引人瞩目。正程图像的误码将引起FF、AP两个标识部分电平升高。这次就是出现EDH Full field和EDH Active picture两项报警。
我们对信号通路中的各个设备进行了逐级测试,并重点对新、旧两种嵌入器进行了对比,发现了症结所在。当信号经过切换台的处理器以后,由于处理器是多年前购置的设备,不具有EDH检测功能,因此在EDH处理上出现了问题,造成EDH Full field和EDH Active picture两项报警。而旧型号的嵌入器在检测到这一错误时,可以将其替换掉,重新生成新的EDH,这样在末级输出时EDH就是正常的,不会出现报警信息。与此相反,新的嵌入器在检测到这一错误时,没有将其替换掉,而是旁通,这样在末级输出时EDH就出现了报警信息。为了解决这个问题,我们与生产厂家进行了联系,经过沟通交流,厂家对板卡进行了升级,增加了我们所需要的功能。这样,输出信号没有了EDH报警,恢复了正常,从而解决了这个问题,我们顺利完成了这次技术改造。由此可见,技术指标测试的确重要,有助于我们及时发现问题,以保证系统始终运行在正常状态。
三. 基于文件的自动检测
随着技术的发展,制播一体化的硬盘播出系统日益成熟,无带化播出将进入一个良性循环,这样,基于文件的检测又成为一个需要研究的课题。
目前,我们采取的方式是将文件转为基带信号后,通过人工技审进行检测。我们在上载集群接入解码通道,在磁带的上载过程中,值班人员通过延时回放,进行监视,发现异常后及时处理:如果上载录制中出现节目实长不对、内容出现静帧、黑场等问题,需要进行修改。上载结束后,还要进行节目的头、尾审看工作,确认节目的开始、结尾及实长,检查是否有漏录和错录现象,发现后也要进行更改。
这种方式需要占用系统带宽,增添硬件设备,还要加重值班人员的负担。由于检测过程中添加了人为的因素,因此一旦疏忽,就有可能查不出问题,从而引发安全隐患。而且,这种方式只是人为地审看视频图象,不能深入到编码的内部,不能检查编码参数是否正确。为此,开发基于文件的自动检测机制就尤为必要。这种自动检测需要满足我们所使用的文件格式,检测的内容要包括以下三个方面:
句法:需要检测编码是否正确,是否符合相应的压缩标准。
参数:需要检测GOP结构、量化、比特率等是否正确。
视音频基带质量:需要检测是否出现静帧、静音等。
在检测的时候,需要有详细的日志记录,以便于值班人员查看和处理。此外,需要注意的是检测的速度问题,不能由于过慢而影响了整个流程。为了安全起见,在基于文件的自动检测后仍然需要保留节目的头、尾审看工序,以做最后的检查。
综上所述,与播出不同的是自动检测系统的发展需要经历一个过程,人们对信号、设备、通路、方式、内容等的认识是逐步建立起来的。检测系统的定位一定要准确,性价比要高,尤其注意不能给播出系统本身造成过大的负担,影响其正常的运行。检测系统要对播出起到很好的辅助和补充的作用,要有助于值班人员预先发现事故隐患,及时进行故障排查,以利安全播出。