微博

QQ

元数据及其应用

2003-03-12 郭斌 北京广播学院电视工程系教授 依马狮网


    广播影视系统的数字化、网络化使计算机几乎渗透到影视系统的每个部门,由传统广播影视系统的“来客”,变为以计算机、网络技术为基础的广播影视系统的“主人”。因此,形成了信息传送的“流”和“文件”两种方式。传统广播影视系统采用流方式推出信息,编/解码处理有损耗,处理中会丢失部分元数据。计算机/网络环境的广播影视系统采用文件方式拉出信息,无编/解码电路,也不会造成损耗,处理中可以保持元数据。显然,两种信息传送方式都与元数据相关。同样,数字化、网络化为媒体资产管理系统的产生和实践提供了条件,从而引起了“频道管理”到“内容管理”的变革。特别是内容管理中为用户提供媒体资料的数据采集、存储、管理、检索、查寻和再利用的问题,使元数据的重要性突现出来。美国电影电视工程师学会(SMPTE)首先对此作了必要的说明,现已成为广播影视界广大用户关心的热点之一。本文仅以《元数据及其应用》为题,予以简要讨论。

一 信息与数据
    人类依靠视觉、听觉、嗅觉、味觉、触觉感知现实世界,得到的是感觉媒体。感觉媒体是人类分析客观现实世界的事物特征及其相互关系所得到的基本概念和基本关系的逼近描述,是对真实世界事物性质及其相互关系的高度概括和抽象,即客观事物在人类头脑里的映射,是人类对用符号表示并传送的、事先不知道其内容的报导,这就是信息。显然,信息来源于人类对客观事物的分析、判断、认识和理解,在人类的头脑里形成了一种信息模型,其基本概念、实体、属性和联系源于实际、高于实际。信息模型要数字化成为计算机可以认识的表示媒体,即二进制编码的数据,以便用计算机进行处理。这种对信息模型数字化的结果,就产生了数据模型(Data Model)。广播影视多媒体原始素材(以下简称原素材)信号是由图像、图形、声音和文本组成的,是一个复杂对象,要采用面向对象的数据模型。因为,面向对象的数据模型具有对象、属性、消息、方法、类的层次结构和继承性等特点,使其具备了表示多媒体等复杂对象和对多媒体信息的管理能力。多媒体数据模型建模时,要考虑如何表示多种媒体数据构造及其属性特征,也要考虑如何表示多种媒体数据之间的信息语义和媒体特性关系。由此可见,数据是表示信息的符号,是信息的载体;信息是对数据的解释,信息的复现要从数据中提取,即数据模型和信息模型之间要具有互换性。

二 元数据与媒体数据
    广播影视节目是在大量采集图像、图形、声音和文本等原素材或原素材描述信息的基础上,经过组接、修剪、纠正和组合编辑而成的。由音频、视频和节目数据(文本)组成的原素材或原素材描述信息是经过数字化、压缩编码、数字处理后用数据表示的,其数据构成了媒体数据的一部分。作为媒体数据的另一部分是元数据,它是描述原素材或原素材描述信息属性的数据,即是与原素材或原素材描述信息数据相关而非原素材或原素材描述信息本身的数据,称为“数据的数据”。即,媒体数据 = 原素材(或原素材描述信息)数据+元数据。例如,中日合拍的电视纪录片《丝绸之路》,其中敦煌一段原素材的摄像师、拍摄时间、拍摄地点、时间长度等都是与原素材相关的元数据,又都不是原素材的组成部分,即不是原素材本身。原素材数据承载的是音频、视频和节目数据组成的原素材信息,元数据承载的是描述原素材数据属性的信息。原素材数据和元数据可根据需要以两种不同的形式组成媒体数据:若重在交互,可采用将素材数据和元数据捆绑在一起的形式;若重在编辑和查寻,可采用素材数据和元数据分离的形式,将元数据存储在别的数据库里。

三 元数据的产生
    1.节目制作早期产生的元数据
    制片人为了将某种有意义的思想转变成有意义的电视节目,并负责把这种思想转变成电视节目的全过程,在前期制作之前就开始节目策划了。如节目的名称、目标、编号、摄制方式、演员、预算等,这些都是节目制作早期产生的的元数据,在节目前期制作时都应将其记录下来。
    2.节目前期制作产生的元数据
    在前期制作中,根据导演的拍摄计划,需要寻找可用资料或拍摄新资料。若是可用资料,会产生资料标识号、磁带格式等元数据;若是拍摄新资料,会产生摄像机类型、镜头(类型/广角或变焦)信息、文件格式、码率、压缩算法、音频格式、音轨数目等元数据。
    3.节目后期制作产生的元数据
    在后期制作中线性和非线性编辑系统都存在。在线性编辑时,需要为每幅画面的唯一位置提供特定的电子信号,称为时间码,这就是所产生的元数据。在非线性编辑时,用时间码数字表示编辑入点和出点,包括镜头间相互转换特性,列出一个编辑决定表(EDL),这个EDL就是所产生的元数据。同样,同步、隐含字幕等都是后期制作产生的元数据。
    总之,节目制作的早期、前期、后期都会产生大量的元数据,这些元数据并非都有用,要根据需要加以过滤,留下关键的,滤除多余的。

四 元数据的应用
    由上述,信息传送的“流”方式和“文件”方式都与元数据有关,考虑到“文件”方式无元数据丢失情况,以计算机/网络为基础的媒体资产管理系统采用“文件”方式传送信息。
    考虑到“流”方式和“文件”方式的兼容性,最好采用“流文件”方式。从现在已经推出的IBM、Sony、大洋、新奥特、奥维迅、索贝、捷成世纪等公司的媒体资产管理系统来看,尽管各自的方案各不相同,但元数据担负着媒体存储与归档管理的任务是共同的,即在海量信息环境下元数据承担着检索、查寻和控制(版本信息、音视频数字解码、访问和分级存储)等关键性工作。

分类名称
主要用途
信息
基本元数据
音视频原素材的解码素材的唯一标识符、音视频素材格式等
访问元数据
提供和控制原素材的访问与获取素材的版权信息、访问权限信息等
参数元数据
识别原素材的一般参数镜头信

视听科技视频号 广告
发表评论