认识视频编解码器

2008-11-21 编辑部 INFOAV CHINA

    编解码器是近几年出现的一个新名词，在音视频应用环境中，编解码器技术是一项非常重要的核心技术。编解码器是数字视频信号压缩或解压的设备。以前，视频都以模拟信号的形式存储在磁盘上，压缩碟片问世之后，模拟音频信号格式从此被数字格式取代，并逐渐开始以数字格式存储视频信号。
    通常我们所称的编解码器技术来源于两种叫法：一是压缩/解压，一是编码/解码器。编解码器是数字音视频信号传输的关键设备。视频编解码器是硬件和软件的结合体，摄像头捕捉到音视频信号后，将数据流进行双向传输。编码器与单纯的信号捕捉设备不同的是，其主要功能是作为信号输出设备，而信号捕捉卡通常都是建立双向信号流，作为文件存储起来。编码器创建的数据流则需要传输到第二个设备上，这个设备有着多种名称如机顶盒等，但它与编码器执行信号传输时的过程是相反的，然后重新建立摄像头捕捉到的信号。
    视频编码器的基本功能有三个：如果摄像头是模拟信号的，编解码器就采样输出信号，采样的速度称为采样率。然后把模拟到数字转换过程中的每个采样信号都转换成一定的比特数据率，这个过程叫做量化。最后，由于信息传输量比较大，编解码器将比特流进行压缩。在数据传输压缩之前，必须通过摄像头先获取图像信息。摄像头感应器从左到右扫描图像，然后垂直录制480line的解析度，并以30帧/秒的速率建立视频图像。

    色度抽样技术
    想象一下这样的图片，摄像头获取的图像上面都覆盖了一层480×720纵线的网格，这个图像会是什么效果呢？因此摄像头对每个方格区域的亮度和色度进行采样，如果采样的图像是8比特的亮度和10比特的三色(10比特/色是业界通用标准)，30帧/秒的比特流就会超过400Mbit/s，这对标清电视信号是不合适的。因此，在1982年采用了CCIR-601标准，该标准中新的采样技术称为4:2:2，每个色差通道的抽样率是亮度通道的一半，水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的视频来说，每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存, 亦既对应图像上相邻的两个像素共用U、V分量，图像处理时在内存中映射为Y0Y1CBCR,此为相邻两个点的数据。其中规定每行的亮度信号取样点数为720个，色度信号取样为360个。另外一种采样技术是4:2:0，它指得是对每行扫描线来说，只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量，也就是说，如果一行是4:2:0的话，下一行就是4:0:2，再下一行是4:2:0...以此类推。对每个色度分量来说，水平方向和竖直方向的抽样率都是2:1，所以可以说色度的抽样率是4:1。PAL制式和SECAM制式的色彩系统特别适合于用这种方式来存储。绝大多数视频编解码器都采用这种格式作为标准的输入格式。对非压缩的8比特量化的视频来说，每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。这些技术称为色度抽样技术。
    那么，为什么亮度采样比色度采样要多呢？由于人眼对色度的敏感度不及对亮度的敏感度，图像的色度分量不需要有和亮度分量相同的清晰度，获取更多的亮度信息比色度信息更能体现图像的精确度，所以许多视频系统在色差通道上进行较低(相对亮度通道)清晰度(例如，抽样频率)的抽样。
    这些技术最开始是由MPEG(移动图像专家组)制定的，该小组的任务就是制定音视频压缩标准。由于我们对水平运动比垂直运动要敏感，很多信息都通过水平运动方式传输到接收器，这种利用接收信号的人的感觉特性，省略不必要的信息，压缩信息量的方法称为感知编码。色度抽样技术和运动估测都属于感知编码技术。抽样和量化建立的比特流再发送到编解码器进行压缩。
[Page]

认识视频编解码器

    压缩
    压缩有两种方法：无损压缩和有损压缩。无损压缩格式是毫无损失地将声音信号进行压缩的音频格式。常见的像MP3、WMA等格式都是有损压缩格式，相比于作为源的WAV文件，它们都有相当大程度的信号丢失，这也是它们能达到10％的压缩率的根本原因。而无损压缩格式，就好比用Zip或RAR这样的压缩软件去压缩音频信号，得到的压缩格式还原成WAV文件，和作为源的WAV文件是一模一样的。但是如果用Zip或RAR来压缩WAV文件的话，必须将压缩包解压后才能播放。而无损压缩格式则能直接通过播放软件实现实时播放，使用起来和MP3等有损格式一模一样。无损压缩格式就是能在不牺牲任何音频信号的前提下，减少WAV文件体积的格式。
    无损压缩格式是利用数据的统计冗余进行压缩可完全恢复原始数据而不引起任何失真，但压缩率是受到数据统计冗余度的理论限制，一般为2:1到5:1。这<