概述
随着广播电视技术日新月异的发展,计算机技术、信息技术及由这些技术衍生的相关技术已经逐渐成为广播电视不可分割的部分。工业控制计算机、服务器、工作站等以电脑技术为核心的设备成为广播电视系统的重要组成部分。本文是以播出工业控制计算机为例,简析该类设备在广电领域的应用与维护的经验。
一. 设备的应用环境
目前,各电视台的播出系统大都采用硬盘服务器播出方式,视频文件存储在视频服务器中,周边的协调设备采用快速计算的服务器,核心控制设备采用工业控制计算机(简称“工控机”,下同)。在现有的硬盘播出系统中,节目的安全播出是靠工控机向各个相关设备发出命令,使整个系统协调运作的。工控机接收由节目单编辑机编辑好的节目单,并按照节目单控制相关设备的播出、切换来保证节目准确的播出。
工控机所控制的主要设备有:
1.视频服务器:工控机向视频服务器发出播出(PLAY)、准备(CUE)、释放(RELEASE)以及查询素材等命令,控制视频服务器的按时、正确播出;
2.视音频矩阵:由工控机控制视、音频矩阵对演播室信号、录像机信号以及视频服务器等信号源进行切换;
3.视频处理器:由工控机控制处理器进行台标的叠加,同时控制节目源的声道选择;
4.播出录像机:由工控机向录像机发出预卷带、播放、停止、倒带等等命令,使录像机按时播出。
工控机还负责对节目素材是否备妥进行检测,对硬盘服务器、矩阵、切换台、录像机等设备的链接及工作状态进行检测并收集信息,并将工控机自身的工作情况一并发送到数据采集服务器,便于综合报警系统对系统的监测。
综合来看,所有这些设备均是以计算机技术为基础的设备,且设备的数量相当庞大。仅以工控机为例,中央电视台播出系统作为核心的播出工业控制计算机(工控机)数量就在127台。因此,维护好服务器、工控机等计算机设备是保证安全播出的重要部分。
二. 设备故障分析
中央电视台在用播出系统播出工控机类设备2006年至2008年的故障统计数据如下表:
2008年我部门的工控机硬件故障共20台次。综合分析这些故障,2次因为硬盘损坏造成故障,1次因为电源损坏造成设备故障,2次因为风扇损坏造成设备故障,其余15次均为因CPU散热器脱落而引发的设备故障。究其原因,支架采用的工程塑料材质强度不高,长期使用后支架卡口材料疲劳,无法承受CPU散热器固定卡对其产生的应力,使CPU散热器支架结构性损坏造成散热器脱落。
分析以上数据,2006年因风扇损坏引发的故障为零,散热器脱落引发的故障为5次,相对于2007及2008年比较少。这是因为硬盘播出系统刚刚建成,工控机还很新,支架的材料疲劳还未达临界点,但散热系统的隐患已经初露端倪。2007年风扇故障已达4次,而散热器脱落成为频繁出现的故障,达18次之多。散热器故障造成的故障率达到69.2%,这一年散热系统故障突出显现出来。2008年总结了前一年的设备故障,将散热系统的维护更换安排到日常设备维护中,逐步替换有隐患的散热设备,使工控机中散热系统故障呈下降趋势。
就上面所述的故障情况来看,风扇故障会造成无法为散热器提供足够的风量带走散热器上的热量,使设备无法正常运行;散热器脱落则直接造成CPU过热,无法运行。现代计算机技术中最重要的CPU所产生的热量不可小觑。为CPU提供良好、稳定的散热条件是保证设备正常运行的前提条件。下面,我们来详细分析一下维护CPU的散热系统有哪些需要注意的地方。
三. 为芯片散热
CPU(Central Process Unit,中央处理器)作为计算机中的核心芯片,其稳定的运行直接关系着节目的播出安全。计算机运行中,CPU消耗的电能一部分被运算电路消耗,还有很大一部分变成了热能。热如果不传导到空气当中,将在CPU中累积起来,当达到一定界限—最高温度容限(根据芯片型号不同,温度容限也不同,具体参数请参照芯片生产商的白皮书)时,系统运行将进入不稳定状态,其结果轻则运行缓慢影响程序执行,重则使整个系统崩溃。

运行中的CPU热分布图
图1为红外热成像摄影机所拍摄的CPU运行中的热分布图。如图中所示,亮色区域为CPU中温度较高的区域,暗色区域为温度较低的区域。图右侧为温度图谱标尺。对照标尺中的图谱我们可以基本了解,CPU运行时温度最高可能达到80摄氏度左右(图中高亮度区域),而温度在CPU上斑驳的暗色区域为硅脂涂抹不均匀所致(将在后文详述)。因此良好的散热系统成为系统运行稳定与否的关键因素。
1.了解CPU构造
图2所示,为我们肉眼所见CPU的全貌,由金属封盖,PCB基板,接针(接点)构成。其中金属封盖上标明产品的型号、序列号以及产地等信息,制造商封装时由激光标注。CPU的内核(DIE)通常不到2平方厘米,但功耗却达到几十瓦,如果不能及时将热量传导出去,热量一旦在DIE中积聚,将会导致严重的后果。金属封盖最大的作用就是将我们肉眼无法看到的封盖内部的DIE产生的温度传导到外界,扩大散热面积,使CPU不致因积热而高温烧毁。

图2 典型CPU的外观

图3 CPU的截面构造
如图3所示,我们可以清楚看到内核与金属顶盖紧密接触。一般金属顶盖选用铜作为原料,可以使热量均匀散布到整个顶盖。因此只要将顶盖的热传导至空气中即可为CPU的稳定运行提供良好的热环境。
2.安装散热器及风扇
当工控机出厂时,CPU散热器已经安装就位,而本部分介绍的是维护工控机时更换散热器或者更换CPU时的散热器安装。
在安装散热器之前在CPU上抹上适量的散热硅脂。如图4
安装散热器时首先要将散热器垂直于CPU上方慢慢放下,切忌不要用力。当散热器底部的金属与CPU顶盖接触完全后,用力将散热器卡扣与CPU插槽连接在一起。(如图5)
之后是最关键的一步,在确定散热器扣具另一端的卡扣已经与CPU插槽扣在一起之后,在保持散热器底部水平与CPU接触之后,双手用力慢慢将金属扣具一端的卡扣按在CPU插槽上。如图6。至此散热器安装成功。之后,将散热器风扇的接口连接至主板相应的位置上。
 图4 涂抹适量的散热硅胶 |
 图5 安装一侧扣具 |
 图6 安装另一端扣具 |
四. 影响散热的因素及分析
并不是我们安装好散热器后就能完全满足CPU的散热要求。影响散热的几个比较大的因素有散热器的用料及制作工艺,散热风扇的设计以及散热硅脂的选择及涂抹方法。下面将逐一介绍。
1.热传递原理
要解决CPU散热问题,首先让我们了解一下热传递的基本原理。从微观来看,区域内分子受到外界能量冲击后,由能量高的区域分子传递至能量低的区域分子。热传递主要有三种方式:
·传导:物质本身或当物质与物质接触时,能量从温度较高的物体传到温度较低的物体,这种能量的传递就被称为热传导,这是最普遍的一种热传递方式,由能量较低的粒子和能量较高的粒子直接接触碰撞来传递能量。相对而言,热传导方式局限于固体和液体,因为气体的分子构成并不是很紧密,它们之间能量的传递被称为热扩散。
[Page]热传导的基本公式为:Q=K×A×ΔT/ΔL。其中Q代表为热量,也就是热传导所产生或传导的热量;K为材料的热传导系数,热传导系数类似比热,但是又与比热有一些差别,热传导系数与比热成反比,热传导系数越高,其比热的数值也就越低。公式中A代表传热的面积(或是两物体的接触面积)、ΔT代表两端的温度差;ΔL则是两端的距离。因此,从公式我们就可以发现,热量传递的大小同热传导系数、传热面积成正比,同距离成反比。热传递系数越高、热传递面积越大,传输的距离越短,那么热传导的能量就越高,也就越容易带走热量。
·对流:对流指的是流体(气体或液体)与固体表面接触,造成流体从固体表面将热带走的热传递方式。
具体应用到实际来看,热对流又有两种不同的情况,即:自然对流和强制对流。自然对流指的是流体运动,成因是温度差,温度高的流体密度较低,因此质量轻,相对就会向上运动。相反地,温度低的流体,密度高,因此向下运动,这种热传递是因为流体受热之后,或者说存在温度差之后,产生了热传递的动力;强制对流则是流体受外在的强制驱动(如风扇带动的空气流动),驱动力向什么地方,流体就向什么地方运动,因此这种热对流更有效率和可指向性。
热对流的公式为:Q=H×A×ΔT。公式中Q依旧代表热量,也就是热对流所带走的热量;H为热对流系数值,A则代表热对流的有效接触面积;ΔT代表固体表面与区域流体之间的温度差。因此热对流传递中,热量传递的数量同热对流系数、有效接触面积和温度差成正比关系;热对流系数越高、有效接触面积越大、温度差越高,所能带走的热量也就越多。
· 辐射:热辐射是一种可以在没有任何介质的情况下,不需要接触,就能够发生热交换的传递方式,也就是说,热辐射其实就是以波的形式达到热交换的目的。
既然热辐射是通过波来进行传递的,那么势必就会有波长、有频率。不通过介质传递就需要物体的热吸收率来决定传递的效率了,这里就存在一个热辐射系数,其值介于0~1之间,是属于物体的表面特性,而刚体的热传导系数则是物体的材料特性。一般的热辐射的热传导公式为:Q=E×S×F×Δ(Ta-Tb)。公式中Q代表热辐射所交换的能力,E是物体表面的热辐射系数。在实际中,当物质为金属且表面光洁的情况下,热辐射系数比较小,而把金属表面进行处理后(比如着色)其表面热辐射系数值就会提升。塑料或非金属类的热辐射系数值大部分都比较高。S是物体的表面积,F则是辐射热交换的角度和表面的函数关系。Δ(Ta-Tb)则是表面a的温度同表面b之间的温度差。因此热辐射系数、物体表面积的大小以及温度差之间都存在正比关系。
任何散热器也都会同时使用以上三种热传递方式,只是侧重有所不同。以CPU散热为例,热由CPU工作不断地散发出来,通过与其核心紧密接触的散热片底座以传导的方式传递到散热片,然后,到达散热片的热量,再通过其他方式如风扇吹动将热量送走。整个散热过程包括4个环节:第一是CPU,是热源产生者;第二是散热片,是热的传导体;第三是风扇,是增加热传导和指向热传导的媒介;第四就是空气,这是热交换的最终流向。
一般说来,依照从散热器带走热量的方式,可以将散热器分为主动式散热和被动式散热。所谓的被动式散热,是指通过散热片将热源如CPU产生的热量自然散发到空气中,其散热的效果与散热片大小成正比,但因为是自然散发热量,效果当然大打折扣,常常用在那些对空间没有要求的设备中,或者用于为发热量不大的部件散热。主动式散热就是通过风扇等散热设备强迫性地将散热片发出的热量带走,其特点是散热效率高,而且设备体积小。
(未完待续)