【关键词】 广播电视 数字化 编码
随着2003年已经启动的广播电视数字化的推进,我国将在2005年开展数字卫星直播业务,2008年全面推广地面数字电视,2015年停止模拟电视播出,实现数字广播电视有线、卫星和无线的全国覆盖。
目前,我国广播电视在节目采集、制作、播出、传输环节已基本实现数字化,采用数字技术后,百姓家庭电视机可以看到DVD般清晰的电视图像,享受到电影院的音响效果,频道可从几十套增加到几百套,用户不仅能看到现有电视频道,还能欣赏到新开办的节目,还可获得如电视政务、电视商务、即时天气预报、股票信息等大量的资讯信息和服务。我国目前的4亿台电视机将成为一个集公共传播、信息服务、文化娱乐、交流互动于一体的多媒体信息终端。
从我国的广播电视数字化推进目标可以看出,目前数字化技术的主要发展趋势在于电视节目的采集、制作、播出、传输环节。解决好这些环节的数字化技术问题,也就为我国的广播电视数字化进程铺平了道路。
数字电视节目的采集方面,也就是数字电视节目的获取,该过程主要是通过对摄像机拍摄到的画面进行数字信号的转换过程,其实质就是模拟/数字(A/D)变换。也就是将一种连续范围的模拟信号转变成特定数字编码的过程。对于那些需要处理、存储、编译和管理各种模拟数值的各种数字设备和系统而言,为了同各种模拟的拾取单元和系统进行接口,这种变换是必须的。但是需要注意的是,模拟/数字的变换并不是一个精确的过程。这种不确定性往往是以一种随机的形式发生,因此它的影响相当于引入随机噪声(量化噪声),但这类噪声以数字形式引入模拟信号时并不突出。使的我们的数字信号变换为模拟输出到电视屏幕观看时不至有太大的噪声干扰。对于A/D变换的过程如下图所示。
图中示意了模拟/数字变换器的主要部件。其中低通滤波器的作用主要是将输入的模拟信号限制在有限的频谱内,防止在恢复的模拟输出信号中出现虚假的部分。至于采样、量化、编码的过程不在此赘述。
对于目前主流的采集方式有必要探讨一下:目前数字视频获取的主要方式有两种,其一是将摄像机拍摄得到的信号通过处理以一种视频流的方式进行广播,在拍摄的同时不间断的往外传送,这是通常意义上的媒体流的概念,目前这种方式主要应用在网络当中。其二是将摄像机拍摄得到的画面通过A/D转换的处理使之形成为一种数字的视频文件,这种文件可以以数字的形式被加工处理,并再次以文件的方式进行保存,这种形式就是目前数字电视中广泛使用的模式。这里我们主要对此进行探讨。
谈到数字视频的采集,存在着非常特殊的一个方面,采集的目的大都是为了进行后期的节目制作。所以,到目前阶段,视频采集卡已经和非线性编辑卡合二为一了。在视频采集卡这个领域中,一直走在世界前列的无外乎美国的PINNACLE公司和加拿大的MATROX公司等品牌大公司。当然Sony等一些在电视领域中有举足轻重作用的公司也对数字电视的发展带来了巨大的贡献,但是在数字视频采集的过程而言上述两家公司的产品发展代表了数字视频采集技术的发展。就采集技术的发展而言,大体经过以下几个阶段:M-JPEG compression without compromise(M-JPEG的无损压缩),无压缩,DV、DV50和MPEG-2。
在这几个阶段中,具有代表性的采集产品主要有DigiSuite LE(用于压缩M-JPEG格式的视频),DigiSuite LX、DigiSuite DTV、TARGA3000系列主要用于处理MPEG-2视频。对于电视数字化技术在采集和处理过程中主要涉及到的就是M-JPEG和MPEG-2的视频。因此模拟视频转换为数字文件的关键也就在于转换过程的编码方式上。
随着编码技术的不断发展,电视数字化技术也随之有了长足的进步。要了解数字化采集技术,压缩技术是其基础。对于压缩系统,主要包含如下组件:数字化,取样和分割,该组件首先是在图形元素的某一栅格内把模拟信号转变为数字信号,然后把视频输入分割为图像帧,再分成像素块。降低冗余度,使用可逆转换技术,用尽可能少的非相关数据来表示原始数据信息。降低熵值,通过丢失次要信息而使用较少的比特来表示数字信息。当然这会导致失真,是有损压缩方式。熵编码,对概率较大的图像符号用较短的比特串来表示,对于出现概率较小的图像符号用较长的比特串来表示。这样可以使对一个图像进行编码所需的平均比特数降为最小。
在视频压缩技术中最常用的编码方式主要有帧内编码:通过利用图像帧内部的空间域冗余度来实现视频图像帧的编码,帧间编码:根据前一帧的像素值而预测本帧的像素值的方法来进行帧编码。M-JPEG就是依据上述技术对视频进行编码的。基于去处在自然视频图像中存在的空间和时间冗余度,基本对图像无损,在无损模式中,编码器完整再现一个数字化输入图像。图像压缩比随图像内容不同而有所不同,对于发送静止图像而言,变化的压缩比不是问题,但是对于必须进行实时观看的图像序列,则面临明显的挑战。M-JPEG编码使用帧内压缩,此时每一帧被当作一个独立的信号处理,一系列的帧基本是一个JPEG流。这种构造好处在于易于编辑,对于非线性编辑应用是一个优秀的选择。此外任何独立的帧都可以作为独立的对象进行处理,帧内编码系统又是基于DCT变换的,如下图。
在这种比较复杂的编码器种,对称性是另一个重要问题。这从图2可以看出。M-JPEG的主要缺点在于对带宽和存储的需要,原因主要是它不能提供图像帧之间的差值进行编码。所以这种技术只能提供较低的压缩效率,同时M-JPEG是面向视频分量而非音频分量的方案,所以在解码中也存在一些问题。对于目前数字电视的发展要求不能够适应,因此目前数字电视均采用MPEG-2的编码方式。MPEG-2是MPEG标准中的一种,MPEG标准主要包含三个基本单元,描述如下:
部件1——系统:描述了音频/视频的同步、复用和其他的系统相关单元。
部件2——视频:包含视频信号的编码说明和解码过程。
部件3——音频:包含音频信号的编码说明和解码过程。
MPEG-2同时使用了JPEG标准中的帧内编码和帧间编码。对于帧内编码,它首先把图像的每一帧划分为8×8的像素块,然后对每一块使用基本的DCT技术进行压缩。帧间编码是基于运动补偿(MC)预测,运动补偿预测是双向的暂时预测。
由此可见MPEG是以多种技术因素为基础的标准,图3给出了具有14个帧的一组图片(GOP)标记为I的图片是帧内编码的。而标记为P的图片是通过顺序最近编码的P图片和I图片的编码值来进行预测。一个B图片能使用上述两种方法来预测,也可以利用下一个I和P来预测。为了满足这一要求,图像帧的传送顺序与显示顺序是不同的,两种顺序也如下图所示。
这种MPEG编码的比特流被分成几个层,其中主要的三个是:
视频序列,这是最外一层,它包含了基本的全局信息,比如帧大小,比特率和帧频。
GOP层,包含了视频快速搜索和随机访问信息。GOP的长度是任意的。
图片层,包含被编码的帧。其头部用来定义类型(I,P,B)和在GOP种的帧的位置信息。
MPEG-2标准分为6个档次;简单、主要、信噪比可扩展性、空间可扩展性、高7、影视和4个等级:低、主、高1440、高。档次等同于特征,描绘可利用的特征。等级包含有通常所用的参数,如图像大小,数据率和编码器的缓冲区大小。
对于专业视频应用的MPEG-2标准,最通用的参数是主要级别有关的主要档次。它定义了图像大小为720×575,数据率是15Mb/s,帧频为30帧/秒。所有更高档次都能对主用档次/主用级别的数据流进行解码。尽管MPEG-2具有很多属性,但是主档次/主等级仍几乎是传统视频应用的理想选择。由于更大的图像组结构使得个别帧很难访问。所以提出了4:2:2的影视档次。本质上MPEG对全亮度信号进行采样但是忽略了一半的色度信息,影视档次把色度抽样提高到4:2:2,通过每一个其他元素,就照顾到2个色度坐标轴,从而保证了对原信号的更好再现。
MPEG和其他压缩方案之间的几种主要区别是:MPEG主要是针对视频信息。基本格式是使用单一的颜色空间(Y,Cr,Cb),有限的分辨率和压缩比,还具有处理音频信息的机制。MPEG利用视频流种的